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أهمية مؤتمرات استرجاع النصوص RR‏ 
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cee‏ رفونو ووه 
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NE SE a PA عملية الرد على الاستفسارات‎ 


O DS ستفسارات‎ 
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العنكبوتية الدلالية وتنظيم المعلومات واسترجاعها 111711 
التنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية MEETA‏ 
الوكلاء الأذكياء SS ERASE O OE‏ 
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الاصطناعي E E a teenage see‏ 0 
الذكاء الاصطناعي وتنظيم المعلومات واسترجاعها E‏ 
المراجع Sees‏ 

ثبت المصطلحات me‏ الك eda‏ فاق حم ووو 
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Sop) 


إلى الدارسين والممارسين والباحثين فى علم 
cle glad‏ الحريصين على دعم مقومات 
استثمار المعلومات, لتحقيق الأهداف السامية 
للمجتمعات» أهدى جهدى فى هذا الكتاب 
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كلمة المترجم 


الحمد لله رب العالمين» والصلاة والسلام على خاتم الأنبياء والمرسلين» سيدنا 
محمد dey‏ آله وصحبه ومن والاه إلى يوم الدين ... 

فهذا هو الكتاب الرابع الذي أتحمل على نحو ما مسئولية ترجمته إلى العربية» في 
Jle‏ استرجاع المعلومات؛ فقد كانت البداية بكتاب ألن كنت Allen Kent‏ الذي 
صدرت طبعته الأولى في بداية ستينيات القرن العشرينء بعنوان Textbook on‏ 
mechanized information retrieval systems‏ وتر ہنا تلك الطبعة إلى 
العربية» وبينه) كانت الترجمة العربية تنتظر دورها في النشرء صدرت الطبعة الثانية من 
الكتاب نفسه» في مطلع سبعينيات القرن نفسه. بعنوان Information analysis‏ 
and retrieval‏ فضربنا صفحا عن نشر ترجمة الطبعة igi‏ وشرعنافي ترحمة 
الطبعة الثانية» التي صدرت عام e AVT‏ ثم شرفت في مطلع ثإنينيات القرن 
العشرين بنشر الترجمة العربية للطبعة الثانية من GUS‏ فردرك ولفرد لانكستر 
Jas” Wilfrid Lancaster‏ استرجاع المعلومات.... "وني عام ۱۹۹۷ نشرت 
ترجمة الطبعة الثالثة من ذلك PLS‏ 


)١(‏ كنت» ألن. ثورة المعلومات؛ استخدام الحاسبات الإلكترونية في اختزان المعلومات 
واسترجاعهاء ترجمة: حشمت قاسم وشوقي dle‏ مراجعة: أحمد بدر. الكويت. وكالة 
المطبوعات» .1١91/”‏ 

)1( لانكسترء فردرك ولفرد. نظم استرجاع المعلومات» ترجمة: حشمت قاسم. القاهرة» مكتبة 
غريب. NAAN‏ 

)۳( لانكستر فردرك ولفرد وآمي وونر. نظم استرجاع المعلومات. ط۳ ترجمة: حشمت قاسم. 
الرياض. مكتبة الملك فهد ٠۹۹۷ cab lt‏ . 
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وإذا كان OLS‏ ألن كنت قد قدم صورة لمجال استرجاع المعلومات حتى نهاية 
العقد السابع من القرن العشرين» الذي شهد البدايات المبكرة لاستخدام الحاسبات في 
اختزان المعلومات واسترجاعهاء فقد رصدت الطبعة الثانية من كتاب لانكستر 
تطورات المجال حتى منتصف العقد الثامن من القرن نفسه» وواصلت الطبعة الثالفة 
من ذلك الكتاب الاهتمام بها شهده المجال من تطورات» حتى مطلع العقد الأخير من 
القرن العشرين» قبل أن تفجر ثورة الإنترنت شحنة التطورات المتلاحقة» التي لا نزال 
نخوض LE‏ حتى اليوم فحسب» Lily‏ نستشرف أيضا آفاق مستقبلها وتداعياتها 
المرتقبة. ولقد كنت أترقب صدور الطبعة الرابعة من كتاب لانكستر» الذي Ub‏ مبرنا 
بأدائه العلمي واللغوي المتميز. إلا أنه طال الانتظارء ولم تظهر الطبعة الرابعة من ذلك 
الكتاب. وأرى في الكتاب الذي نقدم لترجمته العربية اليوم» ضربا من التعويض 
الجرئي على الأقل. 

فقد صدرت الطبعة الأولى من OLS‏ هتنج تشو Heting Chu‏ في مطلع 
القرن الحادي والعشرين (Tee Vole)‏ وترجمت إلى اللغة الكورية عام 2٠٠١8‏ 
ونشرت في الهند عام .۲٠٠۹‏ ثم صدرت الطبعة الثانية من هذا الكتاب عام Yee‏ 
متضمنة الكثير من الإضافات والتعديلات التي تتناول ما استجد من تطورات» 
وتستثمر رسائل التلقيم المرتد التي تضمتتها آراء النقاد» فيا حظيت به الطبعة 
الأولى من مراجعات. وقد ورد بيان الإضافات والتعديلات تفصيلا في تصدير هذه 


الطبعة الثانية. 
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ولدت مؤلفة هذا الكتاب عام ۷١1۹ء‏ وحصلت عل الليسانس في علم 
المكتبات» من جامعة بكين Peking University‏ في الصين. وعلى الماجستير في علم 
المكتبات والمعلومات» من جامعة ماجل McGill University‏ في كنداء وعلى 
الدكتوراه في دراسات المعلومات من جامعة دركزل Drexel University‏ في 
الولايات المتحدة الأمريكية. ثم عملت تشو أستاذًا مساعداء لمدة عام واحد في جامعة 
سانت جون St. John's University‏ وانضمت إلى هيئة التدريس فى جامعة لونج 
أيلاند Long Island‏ بالولايات المتحدة الأمريكية؛ في سبتمير عام NINE‏ حيث 
تعمل الآن أستاذا بمعهد بالمر لعلم المكتبات والمعلومات Palmer School of‏ 
Library and Information Science‏ وقد ألفت تشو خسة كتب بالصينية» 
حول استرجاع المعلومات» وما يتصل به من موضوعات. وتشمل اهتمامات تشو في 
البحث والتدريس» استخدام تقنيات المعلومات في المكتبات وتنظيم المعلومات 
واسترجاعهاء ومناهج البحث. والاتصال العلمي» والقياسات الوراقية 
Bibliometrics‏ وفياسات النشاط العلمي .Scientometrics‏ وتتراوح 
موضوعات بحوث تشو ما بين المكتبات الرقمية» والكتب والدوريات الإلكترونية؛ 
ومحركات البحث في العنكبوتية»ء وتطبيقات الجيل الثاني من العنكبوتية 
.Web 0.2‏ 

ومنذ انضمامها إلى هيئة التدريس فى جامعة لونج أيلاندء تقوم تشو بتدريس مقرر 
واحد في المرحلة الجامعية الأولى» وثانية مقررات في مستوى الماجستيرء كما أدارت همس 
قاعات للبحث للدكتوراه. وتشمل خدمات تشوفي لونج أيلاند المستويات 
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المحلية والوطنية والدولية. وتشارك تشو في أعمال GIS‏ لجان على مستوى الجامعة» كما 
تشارك في تحكيم ما يقدم للنشر في ست دوريات متخصصة في علم المعلومات» فضلا 
le‏ يصدر عن دارين للنشر من كتب» كما أنها عضو في مجالس تحرير عدد من 
الدوريات المتخصصة في علم المعلومات. وفضلا عن كثافة الاستشهاد المرجعي 
بأعمالهاء كثيرا ما تتلقى تشو طلبات الحصول على مستلات من مقالاتهاء من أناس في 
ake‏ أنحاء العالم. 


هذا عن المؤلفة» فاذا عن الكتاب؟ 


يتكون هذا الكتاب من اثني عشر فصلاء Gl‏ أوها بمثابة agi‏ يلقي نظرة 
شاملة على التطور التاريخي لتنظيم المعلومات واسترجاعهاء ويعرف بعدد من رواد 
المجالء ويناقش المفاهيم الأساس» ويحلل مكونات المجال» ويعرض لأبرز مشكلاته. 
ويعالج الفصلان الثاني والثالث تنظيم المعلومات» موزعا على قسمين؛ يتناول bal‏ 
(الفصل الثاني) الطرق الرئيسة للتنظيم» من التكشيف والتصنيف والتلخيص» بينا 
يتناول الثاني (الفصل الثالث) ما يتصل بالتنظيم من موضوعاتء تبدأ بما وراء 
البيانات» وخصائص النصوص الكاملة ومشكلاتهاء وتنظيم معلومات الوسائط 
المتعددة. وتستأثر اللغة» لما ها من دور رئيس في تنظيم المعلومات واسترجاعهاء 
بالفصل الرابع» الذي يتناول اللغة الطبيعية» واللغات المقيدة» على نحو مقارن» يبرز ما 
لكل من الشكلين وما carte‏ مع الاهتمام بخصائص لغة تنظيم المعلومات واسترجاعها 
في العصر الرقمي. وتتناول الفصول من الخامس حتى التاسع أساليب الاسترجاع» 
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وصياغة الاستفسارات. ويتناول الفصل السادس طرق الاسترجاع» كالبحث أو 
التنقيب والتصفح» والتكامل بين البحث والتصفح في الاسترجاع. ويناقش الفصل 
السابع نماذج استرجاع المعلومات» بدءا بالمضاهاة كأساسء ثم الجبر البوليني» 
وأنموذج الفضاء المتجهي» وأنمو ذج الاحتالات» وامتدادات الناذج الرئيسة 
لاسترجاع المعلومات» واتجاهاتها الحديئة. ويتناول الفصل الشامن نظم استرجاع 
المعلومات في تسلسلها التاريخيء بدءا بنظم الخط المباشر» ونظم الأسطوانات المكتنزة» 
ونظم الفهارس المتاحة على الخط المباشرء ونظم استرجاع الإنترنت» ويختتم 
بالاتجاهات الحديثة في نظم استرجاع المعلومات. ويتناول الفصل التاسع استرجاع 
المعلومات المتفردة في محتواها أو في شكلهاء كالمعلومات متعددة اللغات» والمعلومات 
متعددة الوسائط» ومعلومات النصوص الفائقة» ومعلومات الوسائط الفائقة. 

ويحظى المستفيد من المعلومات بالاهتتمام في الفصل العاشر» الذي يتناول 
المستفيدين واحتياجاتهم المعلوماتية» والأنموذج المعرفي» وغيره من النماذج التي تركز 
على المستفيد؛ والتفاعل بين المستفيد والنظام» ويختتم بإلقاء نظرة على المستفيد 
واسترجاع المعلومات في العصر الرقمي. وكا في أي نشاط» فإن للتقبيم أهمية لا تنكر 
في تنظيم المعلومات واسترجاعها. ويتناول الفصل الحادي عشر التقييم» من حيث 
مقاييسه» ومعايير تقييم نظم استرجاع المعلومات بكل فئاتهباء فضلا عن القابلية 
للاستخدام بوصفها معياراً للتقييم. ويفسح هذا الفصل المجال ALLL‏ أكبر مشروعين 
للتقييم في تنظيم المعلومات واسترجاعها؛ وهما تجارب كرانفيلد» وسلسلة مؤتمرات 


استرجاع النصوص. 
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ويعالج الفصل الثاني عشر الأخير الذكاء الاصطناعي في تنظيم المعلومات 
واسترجاعهاء ويبدأ بإلقاء نظرة على بحوث الذكاء الاصطناعيء ومعالجة اللغة 
الطبيعية» لما ها من دور محوري في تنظيم المعلومات واسترجاعهاء ثم الجوانب 
التطبيقية لمعالجة اللغة الطبيعية» ثم العنكبوتية الدلالية من حيث هندستها المعمارية» 
وتطبيقاتها في استرجاع المعلومات» والتحديات التي تواجهها بوصفها أحد تطبيقات 
الذكاء الاصطناعي. ويختتم هذا الفصل بدور الذكاء الاصطناعي في تنظيم المعلومات 
واسترجاعها. 

وفضلا عن الثراء المعلوماتي» تتسم المعالجة في هذا الكتاب بالتسلسل المنطقي 
القائم على التدرج من العام إلى الخاصء ومراعاة البعد التاريخي. وعلى هذا النحو 
يكتسب هذا الكتاب الطابع الدراسي» الذي يؤهله للارتباط بمقررات تنظيم 
المعلومات واسترجاعها في البيئة الرقمية. 

وقد حرصت المؤلفة على ربط محتوى الكتاب برصيد الإنتاج الفكري في SLE‏ 
تخصصه. بقوائم المراجع الملحقة بكل فصل. وقد بلغ عدد الأعمال المستشهد بها في 
الفصل الأول 54 عملاء والأعمال المستشهد بها في الفصل الثاني ۲١‏ عملاء وني 
الفصل الثالث ٠١‏ عملاء dy‏ الفصل الرابع VE‏ عملاء وني الفصل الخامس سبعة 
عشر ee‏ وفي الفصل السادس ثانية عشر عملاء وفي الفصل السابع ۲۲ عملاء وفي 
الفصل الثامن £4 عملاء وفي الفصل التاسع OA‏ عملاء وفي الفصل العاشر OY‏ 
عملاء dy‏ الفصل الحادي عشر 44 عملاء dy‏ الفصل الثاني عشر £0 عملا. 
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والإنجليزية هي اللغة الغالبة على الأعمال المستشهد بها. وتتراوح هذه الأعمال 
بين مقالات الدوريات» وتقارير البحوث» وبحوث المؤتمرات» ووثائق المواصفات 
المعيارية» والكتب وفصول الكتب. وتلتزم تشو بأسلوب الاستشهاد المرجعي المتبع في 
المراجعات العلمية؛ إذ تورد بيانات الأعمال المستشهد بها في نباية كل فصلء مرتبة 
هجائيا بأسماء المؤلفين» متبوعة بتواريخ النشر. ويتم الربط بين قوائم المراجع والنص 
بتسجيل هذين العنصرين بين قوسين في المتن. 

ولقد ترددت طويلا أمام مصطلح Representation‏ في عنوان أصل هذا 
الكتاب؛ فلهذا المصطلح ثلاثة مقابلات محتملة في العربية؛ أولهاء وربها OLS‏ أبسطها 
“Ute”‏ وثانيها ”التعبير عن“ وثالثها ”التنظيم“. ويمكن لمصطلح ”التمثيل“ أن 
.يبدو غامضا في هذا السياق. أما ”التعبير عن فيمكن أن يكون مرادفا للتمثيل» بينا 
تشعبت موضوعات هذا الكتاب على نحو يتجاوز المجال الدلالي لكل من ”التمثيل“ 
و”التعبير عن“» ويربطنا بالمجال الدلالي لمصطلح ”التنظيم“» ذلك المصطلح الذي 
ارتبط بالاسترجاع ارتباطا وثيقا. وقد فضلنا هذا المصطلح الأخير, الشامل الذي 
يغطي الجوانب اللغوية والتقنية والتنظيمية والمسلكية للتعامل مع المعلومات. يضاف 
إلى ذلك أن استعمال ”استرجاع المعلومات“ عنواناً للكتاب في هذا المجال يعد كافيا 
في حد ذاته» لأنه دائ) ما يكون هناك وراء الاسترجاع الفعال تنظيم واختزان. 

ومن الطبيعي CES‏ يعالج أحدث تطورات تنظم المعلومات واسترجاعهاء أن 
يتضمن عددا كبيرا من المصطلحات التي تدل على ما استجد من مفاهيم» أو SAE‏ 
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وسيمات جديدة لمفاهيم قديمة. وقد بذلت قصارى جهدي في اختيار مقابلات عربية 
هذه المصطلحات. وما هذه المقابلات العربية إلا اجتهادات» يمكن أن تصيب أو 
تخطى. ونحمد الله تعالى أن هدانا للصواب» ونعتذر عن أي Uns‏ | نقصده. وقد 
حرصت على تسجيل المصطلحات التي وردت في ثنايا الكتاب» ومقابلاتها العربية 
المقترحة» في ثبت ورد في نهاية هذا الكتاب. 
وإذ أقدم ناتج جهدي في ترجمة هذا الكتاب» أرجو أن أكون قد وفقت في نقل 
رسالة المؤلفة كاملة غير منقوصة؛ فقد حرصت قدر طاقتي على مراعاة GLY‏ 
بالتوفيق قدر الإمكان بين نظامين لغويين» لكل منه| بيئته الاجتماعية والثقافية» 
وإمكاناته وخصائصه النحوية والدلالية. وبصدور هذا الكتاب تكتمل بحول الله 
تعالى» رباعية ترصد تطورات جال استرجاع المعلومات على مدى حوالي نصف قرن. 
وأسأل الله تعالى أن يكون جهدي هذا خالصا لوجهه سبحانه» وأن يكون نافعا k‏ 
قصد به» إنه ولي ذلك والقادر cage‏ وآخر دعوانا أن الحمد لله رب العالمين. 
أ.د. حشمت قاسم 
القاهرة 


م7١١5 الآخرة 475 ١ه / أبريل»‎ cole 
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Ghat Metal | تصدير الطبعة‎ 


ما يقرب من GE‏ سنوات منذ انتهيت من تأليف الطبعة الأول من هذا 
الكتاب» في يوليو عام .۲٠١١‏ وتدل الفترة الزمنية في حد ذاتها على الحاجة إلى طبعة 
جديدة» في مجال تنظيم المعلومات واسترجاعهاء سريع التطور. يضاف إلى ذلك 
صدور AST‏ من عشرين مراجعة على الأقل» للطبعة السابقة من هذا الكتاب. وتشتمل 
تلك المراجعات على كثير من الاقتراحات والتعليقات القيمة» التي لا أقدرها عاليا 
فحسب» [ely‏ يمكن أن أود أيضا تضمينها في هذا الكتاب. وقد أصبح هذان السببان 
مجتمعين» فيم| بعد العامل المحفز لتأليف هذه الطبعة الثانية. 

وبين| تم تحديث الكتاب كاملا ومراجعته » تشتمل القائمة التالية على بيانات 
التعديلات الجوهرية التي أدخلتها على كل فصل في الطبعة الحالية: 

« الفصل الأول: إضافة قسم جديد؛ ٠/۲/١ /١‏ عن كارن سبارك جونز 
.Karen Sparck Jones (1935-2007)‏ 


«الفصل الثاني: إضافة قسمين جديدين؛ ۲/ ٤ /١‏ التمييز lee‏ 
Social Tagging‏ و ۲/ ۳/ ٤ /١‏ محتوى المواقع الثرية -RSS‏ 
o‏ الفصل الثالث: إضافة قسم جديد؛ ۳/ ۱/ Y/Y‏ محددات هوية الكيانات 


-Digital Object Identifiers الرقمية‎ 
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الفصل الرابع: إضافة ثلاثة أقسام؛ ١/5 /٤‏ التقسيات الهرمية 
35 وغ / £/ Y‏ التصنيفات المتعارف عليها «Folksonomies‏ و“ / £/ Y‏ 
والتصنيفات التخصصية Ontologies‏ 

ه الفصل الخامس: إضافة عملية البحث / استرجاع خدمات العنكبوتية 
Search/Retrive Web Service (SRW)‏ والبحث / الاستر جاع عن طريق 
المحدد الموحد لمكان المصدر Search / Retrieve via URL (SRU)‏ إلى القسم 


0/ \/¥/ البحث في مراصد بيانات متعددة -Multiple Databare Searching‏ 


« الفصل الثامن: إضافة الجيل التالي من الفهارس المتاحة على الخط المباشر 
5 إلى القسم /A‏ ۳ الفهارس المتاحة على الخط المباشر OPACs‏ الفهارس 
الإلكترونية للمكتبات بوصفها أنظمة لاسترجاع المعلومات» وإدخ ال تعديلات 
جوهرية على القسم ۸/ ٤/۲/٤‏ أساليب الترتيب الطبقي» وإضافة قسم جديد 
Y / /A‏ العنكبوتية ٠.١‏ ونظم استرجاع المعلومات. 

© الفصل التاسع: تعديلات جوهرية في القسم ١/۹‏ المعلومات متعددة 
اللغات» والقسم ۲/۲/۹ استرجاع الأصوات» والقسم ۳/۲/۹ استرجاع 
الصور المتحركة. 

e‏ الفصل العاشر: إضافة قسم جديد ۲/۲/۱۰ الناذج الأخرى لاسترجاع 
المعلومات التي تركز على المستفيد» وإضافة واجهة المستفيد العضوية organic user‏ 
interface (OUD)‏ إلى القسم ٤/١/۳ /٠١‏ نماذج أخرى لتفاعل المستفيد مع النظام. 
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٠‏ الفصل الحادي عشر: حذف القسم ۲/۲/۱١‏ معايير تقييم نظم 
الأسطوانات الضوئية المكتنزة «Evaluation criteria for CD-ROM systems‏ 
وإضافة القسمين ٤/۲/١١‏ معايير تقييم نظم الاسترجاع متعددة الوسائط» 
و١١1/‏ 5/5 القابلية للاستخدام بوصفها معيارًا للتقييم» وإدخال تعديلات جوهرية 
في القسم ۳/۱۱/ ٤/١/۲‏ مهام الاسترجاع. 

o‏ الفصل الثاني عشر: التوسع وإجراء مراجعات جوهرية» تشمل حذف القسم 
Y/Y /VY‏ أنموذج اللغة الطبيعية» وإضافة أقسام جديدة؛ ۱۲/ ۲/ ۲ التلخيص الآليء 
و۳/۲/۱۲ الرد على الاستفسارات» ٤/۲ NY g‏ البحث في اللغة الطبيعية» و 7/١7‏ 
العنكبوتية الدلالية. 

وفضلا عن ذلك أود أن أوضح أن بؤرة اهتمام هذا الكتاب وتوجهه يستندان 
إلى ما تلقيت من تلقيم مرتد feedback‏ حول الطبعة السابقة. ونتناول تنظيم 
المعلومات poly‏ جاعها ARR‏ بادئ ذي بدء» من منظور علم المكتبات والمعلومات» 
لا من وجهة نظر علوم الحاسب. ومن ثم فإن دقائى تصميم النظم وتنفيذهاء 
کالخوارزمیات algorithms‏ على سبيل المثال» لم يتضمنها هذا الكتاب. وثاني» تمت 
معا لجة طرق تنظيم المعلومات بوصفها مكونا لا غنى عنه في عملية استرجاع 
المعلومات؛ لا بوصفها VE‏ موازيا لاسترجاع المعلومات. وههذاء فإن تغطية طرق 
تنظيم المعلومات في هذا الكتاب» أقل حجاً من تغطية أساليب استرجاع المعلومات. 
ثالثاء لم تحظ موضوعات معينة (كسلوكيات البحث عن المعلومات مثلا) إلا بمعالجحة 
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موجزة في هذا الكتاب» وذلك لسببين: )١(‏ م يقصد بهذا الكتاب معالجة هذه 
الموضوعات باستفاضة» (Y)‏ يمكن الحصول على تغطية نمتازة هذه الموضوعات في 
مصادر أخرى» وردت على وجه التحديد بوصفها مراجع في نهاية الفصول 
المتصلة le‏ 

وأود أخير اشكر جامعة لو نج أيلاند Long Island University‏ لمنحي 
إجازة تفرغ» ما كان من الممكن لي بدونها أن أتمكن من تأليف طبعة جديدة من هذا 
الكتاب. كما أني أعترف بكل التقدير للجهود التي بذها مساعدي» طالب الدراسات 
العليا فنفاي أويانج Fenfei Ouyang‏ في تجميع المادة لي. وفضلا عن ذلك فإنني أقدر 
فعلا مشورة وتوجيه سامانتا هيستنجز Samantha Hastings‏ + ) سلسلة كتب 
الجمعية الأمريكية لعلم وتقنيات المعلورمات ASIST Monograph Series‏ 
«Editor‏ وآمي ريف Amy Reeve‏ المحرر التنفيذي للكتب» وجون بي. بريانز 
«John B. Bryans‏ رئيس التحرير والناشر» بمؤسسة حاضر المعلومات 
Information Today Inc.‏ في أثناء إعداد الطبعة الحالية. وإنها لمتعة فعلا أن أعمل 


مع كل هؤلاء جميعا |S‏ هو ا حال دائا. 
هتنج تشو 


لونج BHI‏ نيويورك 
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تصدير الطبعة الأولى 


كتاب آخر حول استرجاع المعلومات؟ نعم لأن هناك موضوعات وتطورات 
جديدة بحاجة OY‏ تعالج في هذا المجال» ونحن على مشارف العصر الرقمي. يضاف 
إل AU‏ قري فلن اميك J pal‏ قطن EEE‏ مي SSAA‏ 
تصبح المعلومات قابلة للاسترجاع. 


ونبدأ بنظرة شاملة على طرق تنظيم المعلومات واسترجاعهاء في الفصل الأولء 
الذي يلقي نظرة على المفاهيم الأساس» والأعلام الأساس» والأحداث الأساس» 
ومراحل التطور الجوهرية للمجال. ويتناول الفصلان الثاني والثالث المقاربات 
الأساس لطرق تنظيم المعلومات؛ والموضوعات الأخرى المتصلة بذلك. ونظراً لأهمية 
اللغة في تنظيم المعلومات واسترجاعها؛ يناقش الفصل الرابع اللغة الطبيعية واللغات 
المقيدة» نوعي اللغة المستخدمين في المجالء بالإضافة إلى علاقات هذين النوعين 
وخصائصههما. وتركز الفصول الخامس والسادس والسابع على مختلف أوجه 
الاسترجاع؛ إجراءات الاسترجاع. ومقاربات الاسترجاع. ونماذج الاسترجاع. ثم 
نتناول بعد ذلك الفئات الرئيسة لنظم استرجاع المعلومات» وذلك في الفصل الثشامن» 
مع اهتمام خاص بنظم استرجاع الإنترنت». النجم البازغ في أسرة نظم استرجاع 
المعلومات. ويستكشف الفصل التاسع استرجاع المعلومات متعددة اللغات» 
ومعلومات الوسائط المتعددة, والمعلومات فائقة التنظيم -hyperstructured‏ 
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ويحظى البعد الخاص بالمستفيد» وهو جانب جوهري في تنظيم المعلومات 
واسترجاعهاء بالتغطية في الفصل العاشر. ويستعرض الفصل الحادي عشر قضية 
التقييم المعقدة» متعددة الجوانب في المجال» ويشمل مقاييس التقييم» وطرق التقييم» 
ومشروعات التقييم الكبرى. ويحلل آخر فصول هذا الكتاب» وهو الفصل الثاني 
عشرء دور الذكاء الاصطناعي واحتالاته في تنظيم المعلومات واسترجاعها. 

ولقد حاولت تقديم نظرة منطقية شاملة» وإن كانت غير تقنية للمجال؛ 
باستعمال لغة جلية بسيطة؛ حيثا أمكن ذلك» لشرح موضوعات معقدة. وينصب: 
تركيز هذا الكتاب على مبادئ وأسس تنظيم المعلومات واسترجاعهاء لا على وصف 
إجراءات أو نظم أو مارسات بعينها في المجال. وبمجرد أن يلم القارئ بمبادئ 
وأسس تنظيم المعلومات واسترجاعها هذه» فإنه يمكن أن يصبح قادرا على تطبيق 
هذه المبادئ والأسس في مختلف المواقف والبيئات. كذلك نولي الاهتمام؛ على وجه 
التحديدء للموضوعات والتطورات [ab‏ يتعلق بتنظيم المعلومات واسترجاعها في 
العصر الرقمي. 

lens‏ يتوجه " تنظيم المعلومات واسترجاعها” نحو المستفيد فإنه يمكن 
لمصممي نظم معالجة المعلومات واسترجاعهاء أن يجدوا هذا الكتاب مفيدا بالنسبة 
للإلمام بالمجال من منظور المستفيدين. وأهدف هنا إلى OLS‏ يمكن أن يكون مفيدا 
لكل من ate‏ بالإحاطة بالمجال» وخصوصا أولئك الوافدين إليه حديثا. وأوصي بقوة 
ob‏ يقرأ المبتدئون الكتاب بالترتيب الذي ورد به محتواه» نظراً OV‏ الفصول المتأخرة 
تستند إلى الفصول المتقدمة. 

وبنظرة إلى ما مضىء فإنه ربا لم يكن لي أن أؤلف هذا الكتاب» في هذه المرحلة 
من حياتي المهنية» ما لم يبادر زميلٍ ريتشارد سميراجليا «Richard Smiraglia‏ 
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بالاتصال المباشر من أجلي. وأعرب عن امتناني أيضا لتلاميذي الذين شاركوني 
اهتمامي بالمجال وحماسي له. كما أقدر أيضا إجازة التفرغ التي منحتني إياها جامعة 
لونج أيلاند؛ فما كان من الممكن بدون هذه الإجازة أن تتاح فسحة الوقت اللازم 
لإنجاز هذا المشروع. كما أود أن Stl‏ مايكل كونيج «Michael Koenig‏ عميد 
معهد Palmer School JL,‏ الذي أنتسب إليه» وجون بريانز «John Bryans‏ 
رئيس تحرير قسم نشر الكتب بمؤسسة حاضر المعلومات Information Today‏ 
hY ٠‏ جعلا نشر مسودتي حقيقة واقعة. 

ولقد كان هذا الكتاب» وإلى حد بعيد» جزءا لا يتجزأ من Glee‏ العائلية» في 
أثناء التأليف؛ OY‏ زوجي وابنتي كانا أيضا منخرطين بعمق في عملي» إذ أصبح هذا 
الكتاب» على سبيل المثال» موضوعا منتظ| للحديث على مائدة العشاء» وغالبا ما 
كانت أسرتي تقضي le‏ الأسبوع» وساعات المساء بدوني في المنزل. وربما كانت ابنتي 
فانجفاي Fangfei‏ أكثر تعرضا ”لاسترجاع Le lall‏ من أي أطفال آخرين d‏ 
سنها؛ فقد كانت تحثني باستمرار على العمل في كتابي» على الرغم من أنها كانت في 
قرارة نفسهاء ربا تفضل أن أقضي الوقت معها. ولقد كان ما حظيت به من حب 
وتفاهم ودعم من أسرتي» مصدرا للطاقة والإلهام على الدوام. 

عع و 


لونج أيلاندء نيويورك 


37 


الفصل الأول 


تنظيم المعلومات واسترجاعها؛ نظرة عامة 


يرجع تنظيم المعلومات واسترجاعهاء الذي يعرف أيضا بالاستخلاص 
والتكشيف والبحث علن/المعلومات ومعالجة المعلومات وإدارتهاء إلى النصف الثاني 
من القرن التاسع عشر» حين| وضعت خطط لتنظيم المعرفة والوصول إليها (كتصنيف 
ديوي العشري على سبيل SLEW‏ عام (Wynar, 1980) )١41/‏ إلا أن البحث في 
تنظيم المعلومات واسترجاعها لم يصبح مجالا#رائيسا في علم المعلومات. إلا بعد نشوب 
الحرب العالمية الثانية. ومنذ ذلك الحين تتجه عقو نر Oe‏ مختلف المجالات» نحو 
هذا المجال الناشئ» بينيا تستخدم تقنيات المعلومات ارجات متفاوتة من التقدم 
والنضج» لتيسير البحث والتطوير في تنظيم المعلومات واسترجاعها. 

ويتسم تاريخ تنظيم المعلومات واسترجاعها هنا وتطوره بالتركيز على الملامح 
الرئيسة لكل فترة زمنية» والرواد البارزين في المجال. ومن ثم فإن المفاهيم الرئيسة التي 
يتضمنها هذا الكتاب تحظى بالمعالجة» مشفوعة بمناقشة للمكونات الجوهرية لتنظيم 
المعلومات واسترجاعها. ونختتم هذا الفصل بمحاولة استكشاف المشكلة الجوهرية 
للمجال؛ وهي كيف يتم الحصول عل المعلومات المناسبة للمستفيد المناسب في 


الر قت الناسب. 
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تاريخ وتطور تنظيم المعلومات واسترجاعها: 

تاريخ تنظيم المعلومات واسترجاعها ليس بالبعيد. وتحدد النظرة الراجعة 
للمجال معالم الطلب المتزايد» والنمو السريع» ومرحلة إزالة الغموض 
0 وووحتقبة المشابكة» بوصفها المراحل الأربع الرئيسة التي 7 ا 
تنظيم المعلومات واسترجاعها في تطوره. 


المراحل الرئيسة: 


الطلب المتزايد (أربعينيات القرن العشرين - مطلع خمسينيات القرن نفسه): 
شهدت الحرب العالمية الثانية الميلاد الرسمي لمجال تنظيم المعلومات 
واسترجاعها؛ فنظرا لظروف الحرب» تم إنتاج عدد هائل من التقارير التقنية والوثائق التي 
تسجل وتوثق أنشطة البحث العلمي والتطويرء المرتبطة بإنتاج العتاد الحربي. ولا يمكن 
للإنسان مواجهة مثل هذه المهمة الضخمة لتنظيم المعلومات واسترجاعهاء دون النظر في 
الجوانب الأخرى ALLL‏ المعلومات cle holy‏ كالانتقاء» والبث والحفظ. وكا ذهب بوش 


‘Bush (1945) 


هناك جبل نام من البحوث» إلا أن هناك دليلا متزايدا على 
Wil‏ نغوص اليوم في مستنقع» نظرا لتزايد التخصص. ويترنح 
الباحث تحت وطأة نتائج وخلاصات جهود الآلاف من الباحثين 
MG oy I‏ الخلاصات التي لا يتسع وقت الباحث 


لاستيعاءهاء وناهيك عن تذكرهاء عندما تظهر (P.101)‏ 
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حقاء لقد أصبحت الحاجة إلى تسجيل الكميات المائلة من المعلومات 
وتنظيمها واضحة تماماء وضاغطة أيضاً؛ ففي مجالات الفيزياء والأحياء على سبيل 
المخال: 


يقدر ما ينشر في العلوم البيوطبية Biomedical‏ على سبيل 
الخال بمليوني بحث (McCandless, Skweir & gu»‏ 
P. 147)‏ ,1964 1 وويمكن الاطلاع على هذه البحوث 
بمعدل اثنين في الساعة» إذا سلمنا OL‏ القارئ dae‏ وبإمكانه 
القراءة بحوالي سبعين لغةء والوثائق في متناول يديه. وإذا OLS‏ 
الاطلاع على الدوريات يقتصر على ساعة واحدة يومياء و7508 
يوما في العام» فإن الاطلاع على إنتاج عام واحد من النتاج 
الفكري العالمي في العلوم البيوطبية» يمكن أن يستغرق أكثر من 
TV.“‏ قرنا )6 .م ,1975 .(Borko & Bernier,‏ 


وعلى الرغم من أنه قد لا يكون من الممكن التعرف على الكم الفعلي 
للمعلومات التقنية» التي تم إنتاجها في العقدين الخامس والسادس من القرن 
العشرين» على وجه الدقة» فإنه من الممكن تقدير كم هذه المعلومات» وفقا لمجال 
العلوم البيوطبية الذي سبقت الإشارة إليه. dy‏ يعد بإمكان البشر الاعتاد عل 
مهاراتهم وذاكرتهم أو إمكانات الملفات الشخصية دون سواهاء من أجل تنظيم 
المعلومات واسترجاعها بكفاءة؛ كلما دعت الحاجة إلى ذلك. وإنها تطلب الأمر 
الاعتماد على الجهود del Dl‏ في مجال تنظيم المعلومات واسترجاعهاء ما أسفر عن 
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النظم المصممة خصوصا لذلك الغرض» حتى وإن كانت نظ يدوية» كالكشافات 
الترابطية coordinated indexes‏ التي ظهرت عام ۱40۱ )1956 .(Gull,‏ 
النمو السريع (من خمسينيات القرن العشرين حتى ثمانينياته): 
تفل عقود هذه الفترة السنوات الذهبية في تطور تنظيم المعلومات 
واسترجاعها؛ فقد دخلت الحاسبات رسميا إلى المجال (ad‏ بین عامي ۱۹۵۷ و909١»‏ 
عندما استخدم هانز بيتر لون Hans Peter Luhn‏ حاسبا LLL Y‏ مضاهاة الكلمات 
المفتاحية ومهام الفرز فحسب. ily‏ للعمل الفكري المتصل بتحليل مضمون 
النصوص التحريرية أيضا )1987 (Salton,‏ 
ويدل ظهور نظم الخط المباشر J online‏ ديالوج DIALOG‏ في ستينيات 
وسبعينيات القرن العشرين» على التحول من الاسترجاع اليدوي إلى الاسترجاع 
الإلكتروني للمعلومات. وقد وصف هان (1996) Hahn‏ نظم الخط المباشر الراكئدة» 
التي تطورت في ذلك الوقت قائلا: 
لقد كانت تتمتع ببعض الملامح المتطورة البارزة» كمكانز 
الخط المباشر والمخرجات المرتبة طبقياء وإدخ ال المترادفات» 
تلقائيا في صيغ أو استراتيجيات البحث» والمنطق البوليني» وبتر 
كواسع الكلمات وصدورهاء والبحث في المراجع المستشهد بهاء 
وبحث النصوص الحرة للغة الطبيعية. وكانت بعض النظم 
تتضمن برامج لتجميع البيانات لمراقبة الإفادة من النظم ومدى 
الرضا AP. 34) gs‏ 
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وإلى جانب نمو نظم الخط المباشر ونضجهاء تم تطوير أساليب آلية وتلقائية 
لتنظيم المعلومات واسترجاعهاء وإجراء التجارب على هذه الأساليب» مدعومة 
بالتطورات التي شهدتها تقنيات استخدام الحاسبات أو الحوسبة. وكرست عناصر 
بشرية من مختلف المجالات» وخصوصا علوم الحاسب» جهودها للبحث والتطوير في 
هذا المجال» إلا أنه كانت هناك مشكلات أخرى تنتظر البحثء. كما أوجز سالتون 
Salton (1987)‏ في أحد أعماله: 
على الرغم من أن قدراً كبيرا من التقدم قد تحقق. خلال 
السنوات الثلاثين الماضية؛ في معالحة النصوص واسترجاع 
المعلومات» وخصوصافي قطاعات تحرير النصوص وإنتاج 
الوثائق. وتحديد أو تعيين المصطلحات الكشفيةء والتجميع 
الديناميكي لعمليات البحث وصياغة الاستفسارات» فإنه لا يبدو 
هناك سوى تطورات جوهرية محدودة في مجالات الاستيعاب 
ا حقيقي للنصوص )379 (P.‏ 
مرحلة إزالة الغموض (ثانينيات القرن العشرين وتسعينياته): 
على الرغم من أن نظم الخط المباشر التي سبقت الإشارة إليهاء كانت مصممة 
للمستفيدين ذوي الفئات المختلفة من الاحتياجات المعلوماتية» فإن تلك النظم لم تكن 
مصممة على النحو الذي يكفل للمستفيدين إجراء عمليات البحث فيها مباشرة» دون 


أي تدريب أو مساعدة من اختصاصيي المعلومات. وبعبارة أخرى فإنه لم يكن هناك 
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سوى الوسطاء كاختصاصيي المكتبات وغيرهم من اختصاصيي المعلومات» من 
يستطيعون إنجاز مهام البحث نيابة عن المستفيدين. وفضلا عن ذلك كانت الإفادة 
من مثل هذه النظم باهظة التكلفة» من أجل الوصول إلى المعلومات» نظرا لتقاضي 
مجموعة ضخمة من الرسوم (كرسوم الاتصالات بعيدة المدى» ther Sly‏ ورسوم 
مراصد البيانات» على سبيل المثال) وذلك مقابل عملية بحث واحدة. وكان مصطلح 
المستفيد النهائي يدل حينئذ على أولئك الذين يحتاجون إلى نوع ما من المعلومات» 
ET‏ وهاي جز Gather‏ از اده pals‏ 
تغير معنى مصطلح المستفيد النهائي تدريجياء عندما بدأ استخدام الحاسبات الشخصية 
في استرجاع المعلومات» وعندما بدأت نظم الأسطوانات المكتنزة (CD-ROM‏ 
والفهارس المتاحة على الخط المباشر (OPACS)‏ تطبق في منتصف ثانينيات القرن 
ep peal‏ 

لقد كان التعامل مع نظم استرجاع المعلومات على الخط المباشر يتم » فا مضى 
عن طريق وسائل متنوعة» كالمنافذ الطابعة printer terminal‏ ومنافذ أنبوبة أشعة 
المهبط (CRT)‏ ومن نافلة القول أن التفاعل بين من يقوم بإجراء عمليات البحث من 
جهة» والنظام من جهة أخرىء لم يكن جاذبا أو متعاطفا أو ميسرًا. وعندما دخلت 
الحاسبات الشخصية إلى استرجاع المعلوماتء تبين للمستفيد النهائي أن عملية 
الاسترجاع كانت تبدو أقل رهبة ما كانت عليه بكثير؛ نظرا لأنه أصبح من الممكن 
إجراء شكل ما من “Gobel”‏ الودية» أو التفاعل بين المستفيد والنظام. 


وقد أدى تطبيق نظم الأسطوانات المكتنزة (CD-ROM‏ والفهارس المتاحة على 
الخط المباشر OPACs‏ إلى أن يصبح من الممكن للمستفيد النهائي إجراء عمليات 
البحث canal‏ وذلك بالقضاء على غموض نظم استرجاع المعلومات الذي كان قائ| 
من قبل» في شكل الخط المباشر فقط» |S‏ كان هؤلاء المستفيدون موزعين جغرافيا في 
أماكن نائية» ولم يعودوا بحاجة OY‏ يحفلوا بتكلفة الخط المباشرء عندما يقومون 
بالبحث» وذلك في نظم الأسطوانات المكتنزة» والفهارس المتاحة للجمهور على الخط 
المباشر. ومنذ ذلك الحين أصبحت نظم استرجاع المعلومات» وعلى نحو متزايد» نظم) 
مصممة للمستفيدين النهائيين ولتستخدم من جانبهم. 
حقبة المشابكة dio)‏ تسعينيات القرن العشرين حتى الآن): 

لقد كان استرجاع المعلومات حتى ذلك الوقت نشاطا مركزياء LE‏ يعني أن 
مراصد بيانات نظم استرجاع المعلومات كانت تدار ماديا في موقع مركزي واحد. وإذا 
كان هناك من يرغبون في الإفادة من عدة نظم»ء كان عليهم إقامة علاقات مع نظم 
الاستر جاع المعنية كل على حدة. وفي مقابل ذلك. يكفل البحث اللامركزي 
للمستفيدين» الوصول إلى معلومات مراصد البيانات» باستخدام البنية الأساس 
للمشابكة .network infrastructure‏ ولم تعد نظم استرجاع المعلومات تقتصر على 
منطقة جغرافية واحدة. وقد جعل ظهور الإنترنت من استرجاع المعلومات التشابكي 
حقيقة واقعة» بتوفير البنية الأساس اللازمة لهذا التطبيق. 

وبالإضافة إلى مقومات البحث اللامركزي» أدت الإنترنت إلى إعادة تحديد 
معالم جال تنظيم المعلومات واسترجاعهاء فلم يحدث من قبلء في تاريخ تنظيم 
المعلومات واسترجاعهاء أن استخدمت الكلمات المفتاحية الإحصائية» وغيرها من 
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الطرق الماثلة» بهذا القدر من الكثافة» في مثل هذا القدر الحائل من التنظيم الفائق 
6 ومعلومات الوسائط المتعددة. ds‏ يحدث مطلقا من قبل في تاريخ 
استرجاع المعلومات أن قام كثير من المستفيدين بإجراء عمليات البحث» على الخط 
المباشر دون مساعدة الوسطاء. ونتيجة لذلك يبدو طابع تنظيم المعلومات في هذه 
البيئة» مختلطاً إلى حد أن مصطلح الأزمة المنظمة organized chaos‏ قد تم سكه 
خصوصًا لوصف الوضع الراهن. ومن ناحية أخرى» أصبح استرجاع النصوص 
الكاملة هو القاعدة وليس الاستثناء» على الإنترنت. وتتاح الآن أساليب الاسترجاع 
التي كانت فيها مضى تقتصر على مختبرات التجارب» وتتاح الآن بسهولة في نظم 
استرجاع الإنترنت» كألتافيستا Alta Vista‏ وجوجل Google‏ وتطبق الآن Ll‏ 
العامة للبحوث التي يمكن الحصول عليها من البيئات التجريبية ا لمنضبطةء على نطاق 
واسع» لتنظيم المعلومات واسترجاعها على الإنترنت. 

وتتمثل حقبة المشابكة في الإنترنتء التي توفر منصة جديدة» ونافذة عرض 
لتنظيم المعلومات واسترجاعها في العصر الرقمي. 
رواد المجال: 


اجتذب Sle‏ تنظيم المعلومات واسترجاعها كثيرا من الموهوبين المهتمين» في 
السنوات الخمسين الماضيةء إلى حد أنه لا يمكن عمليا الإحاطة بكل هؤلاء في هذا 
المقام. إلا أن ما نورد فيا بعد من cp Mel‏ يستحقون المعالجة كل على حدة في هذا 
الكتاب؛ OY‏ إسهاماتهم في المجال جد عظيمة. والمعيار الآخر لاختيار رواد استرجاع 
المعلومات في هذا القسمء أن جميعهم قد اختتموا حياتهم الأكاديمية وقت ASL‏ 
هذا الكتاب. 
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مورقيمر تاوبه )+ (VAVO-141‏ 
حصل مورتيمر تاوبه Mortimer Taube‏ على شهادته للدكتوراه في الفلسفة» 
بجامعة كاليفورنيا في بركلي University of California at Berkely‏ وقد عمل 
اختصاصيا للمكتبات» في الإعارة» والفهرسة؛ والتزويد قبل أن يشغل منصبا في مكتبة 
الكونجرس» ليصبح مساعدا رئيسا للمراجع العامة والوراقة bibliography‏ عام 
(Shera, 1978( 06‏ وني عام ۱۹١١‏ نشا تاوبه مؤسسة الوثئاقة 
Documentation Inc.‏ حيث بدأ هو وزملاؤه استكشاف طرق جديدة لتكشيف 
المعلومات واسترجاعهاء بناء على عقد مع جهاز المعلومات التقنية للقوات المسلحة 
الأمر يكية U.S. Armed Services (Smith, 1993) Technical Information‏ 
.Agency‏ 
وقد أصبح النهج الجديد للتكشيف والبحث» يعرف في النهاية بالتكشيف 
التر ابطي .coordinate indexing‏ وقدم تأوبه مع ألبرتو طومسون Alberto F.‏ 
7 تقريراً بعنوان ”التكشيف الترابطي للمجالات العلمية The‏ 
«Coordinate Indexing of Scientific Fields‏ أمام قسم gyl‏ الفكري 
الكيميائي بالجمعية الكيميائية الأمر يكية American Chemical Society‏ في سياق 
مؤتمرها حول الوسائل الميكانيكية للتوثيق الكيميائي Symposium on Mechanical‏ 
Aids to Chemical Documentation‏ ولم ينشر هذا التقرير مطلقافي دورية أو 


کتاب» إلا أن جال )1987( Gull‏ ضمنه فيا بعد في أحد أعماله كملحق. 
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وكانت الحاجة إلى طرق جديدة للتكشيف والاسترجاع في ذلك الوقت 
مزدوجة؛ فقد أثبت أولا العدد ا هائل من التقارير التقنية وغيرها من فئات الإنتاج 
الفكري العلمي» الذي أسفرت ce‏ البحوث التي أجريت في غضون الحرب العالمية 
الثانية» عدم ملاءمة نظم التكشيف والاسترجاع القائمة» التي كانت يدوية في المقام 
الأول. ثانياء لم تكن الطريقتان الراسختان لتنظيم المعلومات» وهما الطريقة الهجائية 
والطريقة الهرمية (أي رؤوس الموضوعات وخطط التصنيف) قادرتين على استيعاب , 
المجالات التخصصية الحديدة» والتقنيات الحديدة والمصطلحات الجديدة» التي 
أسفرت عنها جهود البحث والتطوير المتصلة بالحرب العالمية الثانية )1993 (Smith,‏ 
وحدث في هذه الظروف على وجه التحديد, أن اقترح تاوبه وطومسون» عام VOY‏ 
التكشيف الترابطي )1987 (Gull,‏ 

وباختلافه عن الطرق التقليدية للتكشيف والبحث» يقوم التكشيف الترابطي 
على استخدام المصطلحات الأحادية Uniterms‏ وتطبيق المنطق البوليني في استرجاع 
المعلومات. والمصطلحات الأحادية مصطلحات مفردة» يختارها المكشفون للدلالة 
على الجوانب المختلفة للوثائق. ويمكن النظر إلى المصطلحات الأحاديةء على نحو ماء 
بوصفها CLUS‏ المفتاحية لأيامنا هذه؛ نظرا OV‏ كليهما يشتق من الوثائق الأصلية» 
ولا يبذل أي جهد من أجل التحكم في المصطلحات (كمراجعة المترادفات والمشترك 
اللفظي homographs‏ على سبيل المثال). وعادة ما يتم استعال عدة مصطلحات 
أحادية للدلالة على حتوى وثيقة cle‏ كا هو ا حال بالنسبة لتكشيف الكلمات المفتاحية. 
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أما المنطق البوليني Boolean logic‏ وهو أحد فروع الفلسفة» فقد طوره 
جورج بول George Boole‏ عام Ly ۰1۸٤٩۹‏ على تحليلاته لعمليات البرهنة 
8 البشرية» والقوانين الأساس التي تحكم العمليات العقلية (Smith,‏ 
(1993. وكانت عمليات البرهنة في نظر بول» إما إضافة مفاهيم أو فئات مختلفة من 
الأشياءء لتكوين مفاهيم أكثر تعقدا وإما تحليل مفاهيم مركبة إلى مفاهيم تحليلية مفردة 
أكثر بساطة )1854 (Boole,‏ ويتم التعبير عن العملية الأول إيجازا بمعامل و AND‏ 
lèn operator‏ تنطوي العملية الأخرى على معاملي أو OR‏ وفيا عدا NOT‏ وبعد 
قرن على وجه التقريب» أدخل تاوبه هذه المبادئ إلى مجال تنظيم المعلومات 
واسترجاعهاء في شكل التكشيف الترابطي. 

وقد أرست جهود تاوبه التراكمية في التكشيف الترابطي» الأساس بالنسبة 
للبحث البوليني في البيئة المعتمدة على الحاسبات. وإذا ما أمكن تقسيم التخصصات 
الموضوعية إلى مفاهيم مفردة» يتم التعبير عنها بالمصطلحات الأحادية» فإنه يمكن 
استخدام الحاسبات لتنظيم ا معلومات التي يتم التعبير عنها بهذا الشكل» والبحث 
عنها. وقد أفضت هذه النظرة'الثاقبة في النهاية» إلى تطوير مختلف نظم الاسترجاع التي 
تقوم بإجراء جميع فئات البحث البوليني» الموضوع الذي نستكشفه بمزيد من التفصيل 
في أجزاء أخرى من هذا الكتاب. وفي الوقت نفسه» أصبحت الكشافات التي يتم 
تطويرها باستخدام طريقة الربط» تعرف بالكشافات الترابطية. وقد سميت عملية 
البحث في هذه الكشافات» بالربط بين الأفكار للعثور على المعلومات التي تدعو 


الحاجة إليها بربط المغاهيم (Smith, 1993) concept coordination‏ 
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بيد أن عبارة التكشيف الترابطي تسمية غير دقيقة )1987 (Gull,‏ وللمزيد من 
الدقة فإنه ينبغي أن يسمى التكشيف والبحث الترابطي» أو بمصطلحات أيامنا هذه 
التنظيم والاستر جاع الترابطي coordinate representation and retrieval‏ نظ را 
لأنه لا يبدو مجرد طريقة للتكشيف» وإنما يستعمل للبحث أيضا. يضاف إلى ذلك أن 
تركيز هذه الطريقة كان ينصب على التحليل أو التحليل والتركيب synthesis‏ نما 
حدا ببعض النقاد (مثل جال 1987 Gull,‏ وباو 1989 (Pao,‏ للتساؤل ما إذا OLS‏ 
التكشيف الترابطي يربط بين الكلمات أم المفاهيم أو الأفكار. كذلك كانت مشكلة 
الربط المزيف سببا في المخاوف؛ نظرا لأنه لم تكن هناك تقنية في هذه الطريقة تحول دون 
حدوث السقط“ false drops‏ فإذا كان موضوع البحث ol Ll‏ على سبيل SLY‏ 
أسطوانة | لحاسب computer desk‏ فإنه يمكن للنتائج المسترجعة أن تشتمل على 
وثائق تتصل بأسطوانة الحاسب بالإضافة إلى حاسب المكتب desk computer‏ 
وعبارات أخرى ترد ہا كلمتا حاسب computer‏ ومكتب desk‏ (كحاسب سطح 
المكتب desktop computer‏ على سبيل المثال). ولا كانت المصطلحات الأحادية يتم 
تخصيصها دون النظر في اللغات المقيدة» فإن جميع العيوب المرتبطة بالتكشيف 
والاسترجاع» باستخدام اللغة الطبيعية (راجع الفنصل السابع) نجدها أيضا في 
التكشيف الترابطي. وفضلا عن ذلك فإنه إذا ما كان التكشيف الترابطي يقتصر على 
الكلمات المفردة دون سواهاء فإن ذلك يبدو جرد قيد يوضع على الطريقتين المجائية 
والهرمية القديمتين» وليس طريقة ثالئة جديدة للتكشيف والاسترجاع 
(Gull, 1987)‏ 
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ومع ذلك فإنه إسهام تاوبه في المجال لا يضارع؛ إذ إنه ابتكر التكشيف 
الترابطي» وأدخل المنطق البوليني في التكشيف والاسترجاع. وكا ذكر جال Gull‏ 
)1956(« إيجازا فإن نظام المصطلح الأحادي أبرز الخصائص التالية» بالمقارنة 


بالتصنيف والفهرسة الموضوعية: 

٠‏ التكلفة الأقل o‏ الحجم الأصغر 

٠‏ التحليل الأسرع o‏ كفالة نقاط وصول أكثر لكل وحدة مكشفة 
o‏ معدل التعطل الأبطأ o‏ التخصص الأكثر 

© الشمول ٠‏ البنيان المنطقي 

« الحياد o‏ البساطة 


« الملاءمة للنشر التراكمى 

وليس هناك أدنى شك فعلاء في أن الدافع الحقيقي للطرق الحديثة لاسترجاع 
المعلوماتء. يرج ع إلى مورتيمر تاوبه منشئ مؤسسة الوثاققة 
(Lancaster, 1968) Documentation Inc.‏ وعندما ننتقل من العصر الإلكتر وني 
إلى العصر الرقمي» يظل تأثير تاوبه على التكشيف والاسترجاع واضحا بجلاء. 
هانز بيترلون (1495 - (IATE‏ 

إذا كان تاوبه ينظر إليه بوصفه الرائد الذي وضع الأساس لاستخدام الحاسبات في 
استرجاع المعلومات» بإدخال المنطق البوليني في نظام المصطلح الأحادي» فإن هانز بيتر لون 
Hans Peter Luhn‏ هو الذي ابتكر فعلا التطبيقات المعتمدة على الحاسب بالنسبة للمجال. 
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فقد كان لون» الذي ولد في ألمانياء مهندسا بالمؤهل» وأصبح مخترعا شهيرا في 
gi‏ ي إم UBM‏ إذ سجل أكثر من ule‏ براءة اختراع. وقد جاءت بداية لون في علم 
المعلومات بوجه cole‏ واسترجاع المعلومات على وجه اللخنصوص. في فترة عامي 
IEA ۷‏ عندما frail‏ به كل من جيمس بري James Perry‏ ومالكوم 
دايصون Malcolm Dyson‏ وسألاه ما إذا كان من الممكن تصميم آلة آي بي إم 
JBM‏ للبحث في المركيات الكيميائية المشفرة Coded‏ وفقا لنظام دايصون et‏ 
(Harvey, 1978)‏ وسرعان ما أبدى (لون) اهتماما ee gab ghl‏ وانضم de ke!‏ 
واختبار نظام إلكتروني رائد للبحث عن المعلومات» ذلك الذي أسماه لون عام 
VASA‏ » منتقي البحث PSY‏ وني «electronic searching selector‏ و أصبح هذا 
الجهاز يعرف lb‏ بعد باسم ماسح )5 0( الضوئي (Schultz, Luhn scanner‏ 
. (71968. وفي عام ١4157‏ كان لون ينفق جانبا متزايدا من الوقت في استرجاع 
المعلومات» وقد نشر أول بحث له في المجال بعنوان ””طريقة جديدة للتسجيل 
والبحث عن المعلومات A New Method of Recording and Searching‏ 
(Luhn, 1953) “Information‏ كذلك أصبح لون مديرًالبحوث استر جاع 
المعلومات بشركة آي بي إم. إذ استكشف وصمم كثيرا من تطبيقات استرجاع 
المعلومات المعتمدة على الحاسبات» التي تبدو اليوم مألوفة في اا 
ومن بين هذه التطبيقات نظام الكلمات المفتاحية في السياق (KWIC)‏ الذي 
ينطوي على ثلاثة عناصر أساس لتنظيم المعلومات واسترجاعهاء فالعنصر الأول هو 
أن الكلمات المفتاحية» لا ال صطلحات المستقاة من خطط التصنيف ورؤوس 
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الموضوعات التقليديةء تستخدم للتعبير عن جميع أوجه BUS‏ واسترجاعها. ومن 
الممكن النظر إلى الكلمات المفتاحية» على نحو ماء بوصفها من أنجال مصطلحات 
تاوبه الأحادية» على الرغم من قلة من حاولوا إجراء هذا الربط. وقد اتبع نمج 
الكلمات المفتاحية هذا منذ ذلك الوقت على نطاق واسع» في تطبيقات كالتكشيف LY‏ 
والاستخلاص (SY‏ والبحث بالكلمات المفتاحية. أما العنصر الثاني لطريقة الكلمات 
المفتاحية فمستمد من كشافات padl‏ ص concordances‏ التي ابتكرها أسلافنا في 
القرن الثالث عشر )1995 .(Wellisch,‏ وبینا تشكل جميع الجمل في وثيقة ما GLAS‏ 
للنص» تشكل العناوين وما شامبها من عناصر وظيفية (كالجمل التي تدل على 
موضوعات الفقرات topic sentences‏ أو العناوين الفرعية) ما يسمى السياق 
بالنسبة لكشافات الكلمات المفتاحية في العنوان Key Word in Title (KWLT)‏ أحد 
امتدادات تطبيق الكلمات المفتاحية في السياق KWIC‏ أما العنصر الثالث في مج 
الكلمات المفتاحية في السياق» فهو تباديل الكلمات المفتاحية الواردة في العناوين 
والمقابلات الأخرى. وعادة ما تتخذ التباديل شكلين للعرض؛ أو AS‏ 
المفتاحية في السياق؛ إذ ترد كلمة مفتاحية بعينها في وسط السياق» وكلمة مفتاحية 
خارج السياق «Key Word Out of Context (KWOC)‏ حيث تعرض كلمة 
مفتاحية بعينها وترد خارج السياق. والكلمات المفتاحية خارج السياق» شأنها في ذلك 
شأن الكلمات المفتاحية في العنوان» أحد أشكال تطبيق الكلمات المفتاحية في السياق. 
وقد أنتج لون الذي سك مصطلح الكلمات المفتاحية في السياق KWIC‏ عام ۸٥۹٠ء‏ 
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بنجاح كشافا للكلمات المفتاحية في السياق للعناوين الكيميائية©) «Chemical Titles‏ 
ليصل بفكرته إلى نتيجة عملية )1966 (Fischer,‏ وج الكلات المفتاحية في السياق 
معلم واضح ولا شك» في تنظيم المعلومات واسترجاعها. 

ويمثل التكشيف الآلي والاستخلاص DVI‏ إسهامات جوهرية» قدمها لون 
لمجال استرجاع المعلومات؛ فباستخدام الطرق الإحصائية» طور لون وروج 
خوارزميات لإنتاج الكشافات والمستخلصات آليا. وفيا يتعلق بالتكشيف الآلي» 
تستند الإجراءات في المقام الأول إلى التقاط الكلمات المهمة (أي الكلمات المفتاحية) 
التي تحمل دلالات» من الوثائق. أما الكلمات التي ترد بكثافة (أي الكلمات عالية 
sacl‏ ادو ات الوكين و الق هة سروك الط وروق ا ) أو الكت 
التي نادرا ما ترد بالوثائق (أي IIS‏ منخفضة التردد» أو الكلمات التي نادراما 
يستعملها البشر فى الانصال) والكلمات التي لا تحمل دلالة أو معلومات 
noninforming words‏ (كالأسماء العامة كتقرير وملخص» وكذلك المصطلحات 
التي تستعمل Ul‏ في صيغة أو عبارة نحوية بعينهاء مثل ”استرجاع المعلومات“(*”) 
في مرصد بيانات للوثائق» لأغراض استرجاع المعلومات) فيمكن استبعادها 
باستخدام قائمة للكلات المستبعدة estop-word list‏ أو بأحد أساليب إحصاء تردد 
الكلمات )1958 (Luhn,‏ وقد أصبح هذا النهج في إنتاج كشافات الكلمات المفتاحية في 
)© حدمة إحاطة جارية في محال الكيمياء. (المتر حم) 
MO)‏ تسمى الكلمات الوظيفية أو النحوية» إذ تؤدي وظيفة نحوية ولا تحمل دلالة موضوعية. (المترحم) 
OI‏ كمضاف ومضاف إليه» أو صفة وموصوف. (المترجم) 
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السياق» وتنويعاتها كالكلمات المفتاحية خارج السياق» والكلمات المفتاحية في العنوان» 
وكشافات الكلمات المفتاحية الأخرى » وحتى يومنا هذاء هي طريقة التكشيف الآلي 
الكامل الوحيدة. وفي| يتعلق بالاستخلاص الآلي» اقترحت طريقتان للتحقق من 
الكلمات المهمة» ثم الجمل المهمةء التي يمكن أن تكون أكثر قدرة على تمثيل وثيقة 
معينة. ويشكل نهج الكلمات المفتاحية» كا سبقت الإشارة إليه» في سياق التكشيف 
الآلي» إحدى طريقتين لبناء المستخلصات الآلية. وتعتمد الطريقة الأخرى على الموقع 
النسبي للكلمات المهمة في الجملة. وبناء على ما ذهب إليه لون (1958) Luhn‏ فإن 
تقارب أربع أو خمس من OLS‏ غير المهمة بين الكلمات المهمة» يبدو أمرا مفيدا 
بالنسبة لالتقاط الجمل المهمة من وثيقة be‏ ويبدو الجمع بين تردد الكلمات المفتاحية؛ 
وتقارب الكلمات المفتاحية في جملة ماء طريقة مناسبة لتوليد المستخلصات الآلية. 
ولقد كان إسهام لون البارز الثالث في She‏ تنظيم المعلومات واسترجاعهاء هو 
تطوير نظم البث الانتقائي للمعلومات (إس دي آي SDI‏ فالبث الانتقائي 
للمعلومات أسلوب للبث الفعال للمعلومات العلمية الجديدة» إلى المستفيدين 
المستهدفين» بناء على سياتهم profiles‏ وقد بين لون )1961( Luhn‏ معالم مقومات 
البث الانتقائي للمعلومات» ومختلف خطوات إدارة نظام هذا البث» ومن بين هذه 
المقومات يبدو وضع وصيانة سمات المستفيدين أهم المهام وأكثرها حيوية. وتشتمل 
سمات اهتمامات المستفيد على قائمة بالكلمات بالإضافة إلى أوزانها الراهنة» و تخضع 


© بيان اهتماماتهم الموضوعية؛ والخصائص اللغوية والنوعية لما يفضلون من وثائق. (المترحم) 
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سمات المستفيد للمراجعة والتعديل تبعا لما يطرأ على اهتمامات المستفيد واحتياجاته من 
تغير. ثم تضاهى السمات بعد ذلك مقابل ما يمثل الوثائق (كالمستخلصات أو 
المصطلحات الكشفية)» وذلك على فترات زمنية محددة (أسبوعيا أو شهريا على سبيل 
(SUI‏ وكما تصور لون فإن بالإمكان تصميم نظم LSS‏ لإدارة الأعمال؛ والنشاط 
العلميء والأنواع الأخرى من الإنتاج الفكري» وذلك بتطبيق مفهوم البث الانتقائي 
للمعلومات )1968 (Stevens,‏ 

وما لا شك فيه» أن لون قد وضع أفكارا UL‏ حقا في حيز التطبيق لتنظيم 
المعلومات واسترجاعهاء بمساعدة الحاسبات» حتى وإن لم تكن كل هذه الأفكار 
من ابتكاره )1968 .(Wellisch, 1995; Stevens,‏ ولا كانت جميع التطبيقات التي 
سبق ذكرها تعتمد على الحاسبات» فإن كفاءة تلك العمليات المتضلة باسترجاع 
المعلومات قد تطورت على نحو جوهري. إلا أن هذه التطبيقات لا يمكن أن تبلغ 
مستوى الجودة التي تتمتع بها بوجه عام الكشافات والمستخلصات ومهام الاسترجاع 
التي تتم يدويا. 


وقد أكسبت لون إسهاماته في المجال» وخصوصا في تنظيم المعلومات 
واسترجاعهاء مكانة مرموقة في تاريخ علم المعلومات» الذي يشكل فيه استرجاع 
المعلومات مكونا رئيسا. واعتمادا على تحليل أعده كارلوس كوادرا Carlos Cuadra‏ 
)1964( تصدر اسم لون الجميع في ثلاث من أربع قوائم للإسهامات الجوهرية» في نظر 
أربعة خبراء في علم المعلومات. كذلك احتل لون المرتبة الرابعة بين حمسة وعشرين مؤلفا 
يتربعون على القمة من حيث غزارة النشر. وهذا رصيد نقاط قام كوادرا بحسابه اعتتادا 
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على البيانات الوراقية (الببليوجرافية). وفضلا عن ذلك احتل لون مكانا ضمن العشرة 
المتربعين على القمة في القوائم الأربع لأعلى المؤلفين المستشهد بأعمالهم بكثافة في المجال. 
وتؤكد جميع التتائج أن لون يبرز كباحث مرموق في علم العلومات» وخصوصاني 
استرجاع المعلومات» بصرف النظر عن طريقة التقييم المستخدمة (كمشورة الخبراء 
وتحليل الكتب الدراسية» وتحليل الاستشهادات المرجعية) )1964 djs (Cuadra,‏ لون 
يرجع فضل إدخال الحاسبات في مجالناء |S‏ كانت له الريادة في كثير من تطبيقات تنظيم 
المعلومات واسترجاعهاء فضلاً عن كونه عاملا محفزاً للبحوث التجريبية في هذا المجال. 


كالفن مورز (VAAE-SANA)‏ 

بالمقارنة بتاوبه ولون» جاءت إسهامات كالفن إن. مورز Calvin N. Mooers‏ في 
تنظيم المعلومات واسترجاعهاء متأخرة كثيرا. فقد كانت مجالات مورز الدراسية هي 
الرياضيات والفيزياء» إلا أنه كرس قدرا كبيرا من وقته للمعلومات وعلوم الحاسب؛ بعد 
التحاقه بمعهد مساتشوستس للتقنية «Massachusetts Institute of Technology‏ عام 
[SV 57‏ وتنمية خبراته في استخدام ا حاسبات )1992 (Corbit,‏ 

information “Ls slab) سك مورز مصطلح "استرجاع‎ ١15٠ عام‎ Bs 
الذي ارتبط منذئذ تكاملياء وبسهولة بلغة علم المعلومات”. وكا ذهب‎ eretrieval 


مورزء OP‏ استرجاع المعلومات يعني العثور على المعلومات التي لم يستدل على مكانها 


(*) لقد سك AIS‏ مورز مصطلح ”استرحاع المعلومات“ ليستعمل بديلا عن م صطلح ”الوثاقة 
“documentation‏ الذي لم يكن يحظى بإجماع القبول في act‏ الناطقين بالإنجليزية. وقد فجر سك 
هذا المصطلح موجة الحدل الذي لا يزال مستمرا حول مفهوم المعلومات. (المترجم) 
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أو على وجودها من قبل )1997 LUIS (Garfield,‏ يرجع الفضل إلى مورز Mooers‏ 
في اقتراح قانون مورز لنظم استرجاع المعلومات: 
يمكن العزوف عن استخدام نظام استرجاع المعلومات» 
حيث| يكون الحصول على المعلومات بالنسبة للمستفيد أكثر مشقة 
وإزعاجا من عدم الحصول عليها (P. ii)‏ 
وقد أعيدت صياغة قانون مورز؛ إذ تنص إحدى طبعاته على أنه Y”‏ يمكن 
استخدام نظام المعلومات إلا عندما يكون عدم استخدامه أكثر إزعاجا من 
استخدامه “ )1987 (Koenig,‏ كذلك اقترح جارفيلد )1997( Garfield‏ نتيجة 
منطقية لقانون مورز: ”كلما كانت المعلومات التي يقدمها نظام الاسترجاع صالحة» 
ازدادت احتمالات الإفادة منه“. وقصارى القولء فإن قانون مورز يدل على نحو 
جوهري» على أن النظم التي ترتبط باحتياجات وممارسات من يفيدون منهاء أكثر 
جدارة بالاستشارة عن طيب خاطر (1996 .(Henderson,‏ 
وبالإضافة إلى سك مصطلح ”استرجاع المعلومات” » ووضع قانون مورز» 
طور مورز نظام ترميز زاتو Zatocoding‏ لفرز nS ote‏ من واصفات الوثائق» على 
بطاقة واحدة مثلومة notched‏ خصوصاء وذلك بتر کیب superimposing‏ شفرات 
واصفات عشوائية من ثانية أعداد eight-digit descriptor codes‏ على هذه 
البطاقات. وكان من الممكن لاستخدام نظام ترميز زاتو أن يسفر عن عندد صغير فقط» 
يمكن التغاضي عنه من الأخطاء false drops‏ عملية البحث الوراقي (Garfield,‏ 
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)1997 كذلك كان مورز مسئولا عن ابتكار تطبيقين موجهين نحو علوم الحاسب» 
وما حساب النصوص وتجميعها (تراك Text Reckoning and Compiling‏ 
«(TRAC‏ ولغة الحاسب فى إكس إم VAM‏ وكان تراك مصمم| على وجه التحديد: 
لمعا حة النصوص غر المنظمة cunstructured‏ بطريقة تفاعلية» على عكس طريقة 

الدفعات. أما لغة فى إكس VXM e)‏ فكانت تستخدم لنظم الشبكات متعددة 


(Corbit, 1992; Henderson, 1998) الحاسبات‎ 


واعترافا بإسهاماته البارزة في جال te‏ المعلومات» منح مورز جائزة 
الاستحقاق من الحمعية الأمريكية لعلم المعلومات American Society for‏ 
Information Science Award of Merit‏ عام VAVA‏ . وتنص شهادة منح الجائزة 
على أنه ”قد أثر في مجال المعلومات» كما أن أفكاره المبكرة تدخل الآن في واقع 
تمارسات اليوم“ )1996 (Henderson,‏ ولقد كان مورز فعلا أحد الرواد العظام في 
مجال تنظيم واسترجاع المعلومات الناشى. 


جيرارد سالتون (15186-191197): 

يتفق كل من ينتمي إلى أوساط استرجاع المعلومات؛ على أن جيرارد سالتون 
Gerard Salton‏ كان واحدا من الشخصيات المرموقة في المجال؛ فقد كان الرجل 
”المسئول في المقام الأول عن تأسيس مجال استرجاع المعلومات وصموده والاعتراف 
به...“ بإنفاق ثلاثين عاما من الجزء الأخير من حياته ”يرعاه بعناية» ويسانده عنندما 
يكون المناخ المهني قاسيا أو غير مواتٍء ويدافع عنه إلى أن يتمكن من من دعم نفسه“ 
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(Grouch, et al., 1996)‏ و إذا ما نظرنا إلى Jle‏ استرجاع المعلومات برمته» بوصفه 
بنيانا تعلوه قبة» فإنه يمكن لسالتون أن يكون القبة» بينم يمكن لزملائه» ومن يلوذون 
به أن يقوموا مقام الأعمدة أو العناصر الأخرى المساندة للبنيان. 

ولقد كانت أداة سالتون البحثية الرئيسة» نظام معالجة النصوص واسترجاعها 
lew)‏ ت «System for the manipulation and retrieval of texts (SMART‏ 
الذي يعرف أيضا من قبيل التندر بوصفه ”مسترجع سالتون الآلي السحري 
للنخصوص “Salton's magical automatic retriever of text‏ وقد غير ت أفكار 
سالتون طرق ables‏ النصوص الكاملة بالحاسب تغيرًا جوهريًاء وأمدت SLE‏ 
استرجاع المعلومات بأسس متينة )1995 (ACM SIGIR,‏ ”وتشمل إسهامات 
سالتون البحثية» المجال الكامل لاسترجاع المعلومات؛ كأنموذج الفضاء المتجهي 
«vector space model‏ ووزن المصطلحات» والتلقيم المرتدالخاص بالصلاحية 
s «relevance feedback‏ التجميع العنقودي clustering‏ والاستر جاع البو ليني 
الممتدء وقيم تيز المصطلحات..وبناء المعاجم.ء وتبعية المصطلحات term‏ 
«dependency‏ وفهم النصوص وتنظيمهاء واسترجاع الفقرات» والمعالحة الآلية 
للنصوصء باستخدام سمارت (Crouch, et al., 1996) “ell SMART‏ ويمكن 
لكل واحد من هذه الإسهامات أن يكون ولاشك» موضوعا لناقشات مستفيضة» 
كا يحظى بعضها با مناقشة في أجزاء أخرى من هذا الكتاب. إلا أنه ليس من قبيل 
المبالغة القول ob‏ سالتون قد أدخل علوم pil‏ والأساليب المعاصرة إلى She‏ 
استرجاع المعلومات. 
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وكانت نظم استرجاع المعلومات التي تعمل على نطاق تجاري» في ستينيات 
القرن العشرين» تستخدم في الأساس المنطق البوليني» وتقنيات استرجاع ما قبل 
سمارت الأخرى. وتطبق اليوم العشرات من النظم التجارية الشهيرة الأفكار 
والتقنيات التي تطورت في سارت. فقد حصلت اتديفيديوال Individual‏ (وهي 
خدمة مقتطفات إخبارية جديدة) على سبيل المثال» على ترخيص استخدام تقنيات 
سمارت مباشرة. وتعد نظم أخرى مثل ندل المعلومات واسعة المدى wide area‏ ` 
gy) information servers‏ يز (WAIS‏ ودا وکویست DOWQUEST‏ وهي إحدى 
أدوات الشبكة LEVI‏ & لداو جونز Dow Jones Newswire‏ تقنيات مشتقة من 
سمارت اشرق ون اماع es‏ زنك کا کر مراك ميو EE‏ ومن بينها 
(ون) WIN‏ 9 وهو نظام استرجاع قانوني» تديره شركة وست للنشر West‏ 
Publishing Company‏ وانكوايري «INQUERY‏ وهي أداة بحث مرموقة أخرى 
(ACM SIGIR, 1995)‏ وهناك أساليب استرجاع معلومات لم يتم اختبارها إلا في 
سيارت» ax yy OVI Gey‏ عاد تين فق tel‏ ات قت pl fl‏ اتات 
كنظم استرجاع الإنترنت. 

وتبدي كل هذه النظم التأثر بمفاهيم سالتون وبحوثه في استرجاع المعلومات» 
كما تطبق هذه المفاهيم والبحوث في البيئات الإلكترونية والرقمية. وفضلا عن ذلك 
كان سالتون Wye‏ غزير الإنتاج؛ فقد نشر خمسة كتب حول استرجاع المعلومات» 
وأكثر من ١5١‏ مقالة بحثية في Sled!‏ طوال خياته المهنية والوظيفية (ACM SIGIR,‏ 
(1995. كذلك كرس سالتون جهوده البارزة للمجال» وحصل في مقابل ذلك على 


Oke جوائز‎ 
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أخبت كارن سبارك جونز Karen Spärck Jones‏ دراستها في المرحلة الجامعية 
الأولى في التاريخ أولاء ثم في الفلسفة بعد ذلك» بجامعة كمبردج بالمملكة المتحدة 
University of Cambridge, U.K.‏ وكانت دراستها للفلسفة هي التي قادتها لمجال 
استرجاع المعلومات» وعلى وجه الخحصوص ما يسمى الآن معالجة اللغة الطبيعية 
(NLP)‏ وفي رسالتها للدكتوراه عام VATE‏ بعنوان ”المترادفات والتصنيف CYAN‏ 
استخدمت نظرية الكتل clumps‏ لتجميع عناقيد المصطلحات )2007 (Wilks,‏ 


ولقد قدمت سبارك جونز بعملها في استرجاع المعلومات لأكثر من أربعة 
عقود» إسهامات جوهريةء في OVE‏ عدة» ى| أثرت في كثير من المحيطين بهاء من 
الزملاء والطلبة على السواء. ومن الناحية الزمنية» كان النهج العجريبي لاسترجاع 
المعلومات» أول هذه المجالات. وفي غضون السنوات النهائية لبحوث سبارك جونز 
للدكتوراه» كانت تجارب كرانفيلد الملحمية قد دخلت مرحلتها الثانية» وبدأت سبارك 
جونز تبدي اهتماما قوياء لا بالنهج التجريبي الذي سلكته دراسات كرانفيلد فحسب» 
BS ils‏ الطر ق والأدوات التجريبية أيضا )2008 -(Robertson & Tait,‏ ثم 
استخدمت سبارك جونز بعد ذلك مجموعة كرانفيلد في إجراء تجارب لاختبار 
التجمعات العنقودية للمصطلحات. لأغراض التصنيف الدلالي» تلك التجمعات 
التي بدأت تستكشفها في بحثها للدكتوراه. 

غير أن بحوث سبارك التجريبية في استرجاع المعلومات» لم تتوقف عندما انتههت 
تجارب كرانفيلد عام NAW‏ وإنما قادت جهدا مشتركا للباحثين المقيمين في المملكة المتحدة» 
في سبعينيات القرن العشرينء لتنمية dy Ale pt‏ جديدة '”مثالية “: بحيث يصبح من 
الممكن إجراء التجارب» خارج حدود مشروع تجريبي واحد كتجارب كرانفيلد. 
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وعلى الرغم من أن هذا الجهد لم يؤت ثاره؛ نظرا لشح الدعم LUN‏ المتوافر في المملكة 
المتحدة» فإنها واصلت العمل الشاق» دون كلل في هذا المجال. وقد قامت سبارك 
جونز بتحرير ”تجار ب استرجاع Information Retrieval “c plal‏ 
Experiment (Spärck Jones, 1981)‏ الكتاب أحادي monograph ç 52 hl‏ 
الوحيد المكرس في المقام الأول» للطرق التجريبية في استرجاع المعلومات» كا كتبت 
أيضا بحثين في ذلك الكتاب. ومن ناحية أخرى» عندما بدأت سلسلة مؤتمرات 
استرجاع النصو ص تر ك Text Retrieval Conference TREC‏ عام 144۲« 
aa is‏ ا التجريبية المثاليةء التي كانت هي وزملاؤها عاجزين 
عن تكوينها قبل عقدين تقريبا. ومنذ البداية؛ شاركت سبازك جونز» ببحماس في 

سلسلة ترك TREC‏ بوظائف أو مهام متعددة (كمستشار غير رسمي للمنظمين» 
وعضو لحنة البرنامج» وعضو مشارك بفريق البحث). والأهم من ذلك» قامت 
سبارك جونز بكتابة سلسلة من البحوث» تلخص وتقارن أداء ae‏ الفرق المشاركة 
في تجارب ترك TREC‏ كذلك سجلت تأملاتها حول الدروس التي يمكن لمجتمع 
استرجاع المعلومات استخلاصها من العدد الحائل من النتائج المتباينة» التي انتهى إليها 
ا مشا ركون في ترك )2000 ,1995 (Sparck Jones,‏ ولم يكن هناك من dol‏ يبدو 
أكثر كفاءة من سبارك جونزء للنهوض بهذه المهمة بالغة الأهميةء نظرا.لاهتمامها طوال 
حياتها بالنهج التجريبي في استرجاع cols gla‏ والتزامها تجاه هذا النهج. 

ويمثل البحث الذي نشرته سبارك جونز عام NAVY‏ عن التردد العكسي 
للوثائق cinverse document frequency idf‏ الا آخر لبحوثهاء وهو JE‏ الطرق 
الإحصائية في استرجاع المعلومات )1972 .(Spdrck Jones,‏ وقد شرحت في ذلك 


coed‏ الذي لا يزال على قمة البحوث المستشهد بها في المجال» كيف يمكن لوثيقة ما 
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أن تكون ables‏ لا لأن الكليات المفتاحية تتردد بكثافة ا فحسبء وإنما SY‏ تلك 
المصطلحات لا تتردد بكثافة في الوثائق الأخرى غير الصالحة أيضا. وبالارتباط 
بخوارزمية تردد المصطلحات term frequency (tf)‏ التي طورتها مجموعة سالتون» 
بجامعة كورنل «Cornell University‏ أصبح الجمع بين التردد العكسي للوثائق cif‏ 
وتردد المصطلحات» أكثر طرق وز البديل الاحتياطي default‏ استخداما لسنوات 
طويلة. وقد أفضى معيار التردد العكسي للوثائق idf‏ فيا بعد إلى وزن الصلاحية في 
الأنموذج الاحتمإلي الذي طوره روب رتصون بالتعاون مع سبارك جونز (Robertson‏ 
Spärck Jones, 1976)‏ . وعلى نحو ماء يشكل جهد سبارك جونز في التردد 
العكسي للوثائق؛ مصدر إلهام لسلسلة من الدراسات التجريبية متينة الأساس لوزن 
' المصطلحات. وقد أثبتت الطرق الإحصائية» alte‏ في التردد العكسي للوثائق» وغيره 
من المقاييس ذات الطابع الماثل» أنها ليست باهظة التكلفة» |S‏ أنها تنافسية أيضا في 
استرجاع المعلومات. ومن الممكن الاطلاع على أحدث شاهد على ذلك في سلسلة 
تر ك )1995 .(Spärck Jones,‏ 
وبامتداد بحوثها حول الطرق الإحصائية في استرجاع المعلومات» إلى مجال أكبر 
ختلف» ولكنه وثيق الصلة؛ بدأت سبارك جونز البحث في ثانينيات القرن العشرين؛ 
في محال جة اللغة الطبيعية» مع التركيز» بوجه خاص على التلخيص الآلي» والرد على 
الاستفسارات» و للع GUL‏ الطبيعية. وكان لدا اعتقاد جازم بأن ASI"‏ 
قائمة في حد ذاتها فقط " (2007 (Wilks,‏ وكانت ترى من العجب أن يتم تمثيل 


النصوص باستعمال لغات (كرؤوس الموضوعات مثلا) بخلاف اللغة الطبيعية 
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(Spairck Jones, 1994)‏ وقد أكسبتها بحوثها حول معالجة اللغة الطبيعية NLP‏ 
مثل: (2007 ,2005 (Spärck Jones‏ في النهاية شهرة كبيرة في ذلك المجال على 
الأقل» كا في المجالات os FV‏ على الرغم من أن معالجحة اللغة الطبيعية تختلف عن 
المجالات الأخرى بالمقارنة. ونظرا لإسهام سبارك جونز الهم في معالجة اللغة 
الطبيعية» نشر la SS‏ لها كتاب بعنوان ”رسم خريطة مسار جديد؛ معالجة اللغة 
الطبيعية واسترجاع Charting a New Course: Natural Language “cls ghall‏ 
Processing and Information Retrieval (Tait, 2005)‏ وهذا ليس الكتاب 
الوحيد.الذي يبرز إسهامها وتأثيرها في معالجة اللغة الطبيعية. والواقع Lef‏ بالإضافة 
إلى الكثير من الكتب الأخرى التي قامت بتأليفهاء اشتركت في تحرير كتاب في BA bes‏ 


(Grosz, Sparck Jones & Webber, 1986) ١ 985 اللغة الطبيعية في عام‎ 


وكانت بحوث سبارك جونز في السنوات التالية» تشمل استرجاع الوثائق 
الناطقة. وبالاشتراك مع زملائهاء كتبت بحثين حصلا على جوائزء تقديرا لعملهم 
الابتكاري حول هذا ا موضوع )2005 (Maybury,‏ وكانت الخوارزميات المحكمة 
غير المقيدة للكلمات المفتاحية» وأساليب استرجاع المعلومات المعتمدة على النصوصن 
المعدلة القائمة» من بين البحوث التي قامت سبارك جونز بإجرائها حول البيانات 


الصوتيةء كالأحاديث ونشرات الأخبار الإذاعية. 


لقد أفاد جال استرجاع المعلومات كثيرا من جهود سبارك جونز» في طريقة 
التردد العكسي للوثائق في وزن الوثائق» ومعالجة اللغة الطبيعية» واسترجاع الوثائق 
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.(Willet & Robertson, 2007) والمنهج التجريبى 3 استرجاع ا معلومات‎ (abii 
وسوف يظل تأثيرها في مجتمع استرجاع المعلومات» كباحث» ومعلم» ومستشار»‎ 


is gh Cl gud Lr poke 


نظرة تفصيلية في المفاهيم الأساس: 


يتضمن عنوان هذا الكتاب أربعة مفاهيم رئيسة؛ هي المعلومات وتنظيم 
المعلومات» واسترجاع المعلومات» والعصر الرقمي. ولكل هذه المفاهيم بلا استثناء 
مرادفات» ومن الممكن تأويلها وفهمها على أكثر من نحو واحد في السياقات 
المختلفة. وقد قصد بالمناقشة التالية شرح معاني ومضامين المفاهيم الواردة في هذا 
الكتاب وبيانها. 


المعلومات: 

لقد حظيت المعلومات كمفهوم بالنظر» وقورنت بمصطلحات كالبيانات» 
والمعرفة» والحكمة» |S) BES‏ في 1992 Meadow,‏ على سبيل المثال)» ومن ثم فإنه لا 
تبدو هناك حاجة بالنسبة لهذا الكتاب» لأن يكرر أو يستطرد في تلك المناقشات 
والمناظرات. ومن ناحية أخرىء فإن SLU‏ ”المعلومات" » و”النصوص“ 
و”الوثائق”'“غالباً ما تستعمل تبادلياً في المجال (مشل ”استرجاع النصوص“ 
و" تنظيم الوثائق“). ووفقالما ذهب إليه لارسن )1999( Larsen‏ 


)*( نضيف هنا أن كارن سبارك جونز شا ركت أيضا في تأليف كتاب حول علاقة علم اللغة بعلم المعلومات: 
Karen Sparck-Jones & Martin Kay. Linguistics and information science. London,‏ 
(q>) Academic Press, 1973.‏ 
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فإن الوثائق» في مجالناء تتسم بأن لها ”سعرا“» ويمكن أن 
تحصى “ne”‏ وهي على هذا النحو المكونات الأساس 
لإحصاءات المكتبات. کا أن معظمها ”یشغل (SNe‏ يمكن 
أن dees os”‏ للتذاول" كي امان of flout of‏ مهل أو 
تبل بمضي الوقت )1020 .5). 
وبالإضافة إلى تعريف لارسن» يمكن للوثائق أن تشمل الوسائط المتعددة. وإذا. 
كانت النصوص تعني المعلومات النصية دون سواهاء فإن ”الوثائق“ يمكن أن تشمل 
معلومات الوسائط المتعددة (بمعنى أي تجميع من المعلومات الصوتية والبصرية 
والصورء فضلا عن المعلومات النصية). ويبدو أن ”المعلومات“ تشمل كلا من 
النصوص والوثائق؛ أي إن مضمونها هو الأوسع بين المفاهيم الثلاثة. 
وقد أجريت في السنوات الأخيرة بحوث حول استرجاع الفقرات» في مقابل 
استرجاع الوثائق )2000 Jones,‏ /76م5). ويدل ”استرجاع الفقرات“ (الذي 
يسمى أيضا استرجاع المعلومات) على العثور على المعلومات» أو الفقرات من الوثائق 
على وجه التحديد (كفقرات أو قطاعات من الوثائق بأطوال متفاوتة) التي يحتاج 
المستفيد إليها. أما ”استرجاع الوثائق“» في مقابل ذلك» فيعني الحصول على الوثيقة 
كاملة للمستفيد النهائي» حتى وإن كانت حاجته تقتصر على فقرة موجزة. وإذا ما 
نظرنا إلى كلمة ”المعلومات“ بوصفها مرادفا ”للفقرات“ كما في “استرجاع 
الفقرات ' فإنه ينبغي أن يكون هناك استثناء» بالنسبة للمناقشة قشة السابقة» فيا يتعلق 
بمضامين ”المعلومات . 
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تنظيم المعلومات: 

LÍ‏ كان الشكل الذي يمكن أن يتخذه عنصر المعلومات» فإنه بحاجة OY‏ يتم 
تنظيمه لكي يكون من الممكن استرجاعه. ويشمل تنظيم المعلومات اقتطاف بعض 
العناصر (كالكلهات المفتاحية أو العبارات على سبيل (GL‏ من الوثاتق» أو تعيين 
مصطلحات (كالواصفات أو رؤوس الموضوعات على سبيل المثال) للوثائق» بحيث 
يكون من الممكن تحديذ معالم مضمونهاء أي تمثيلها. وعادة ما يكون من الممكن تنظيم 
المعلومات عن طريق أي تجمع من الوسائل التالية: الاستخلاص» والتكشيف» 
والتصنيف» والتلخيص» والاقتطاف. وعلى الرغم من اختلاف معاني “معالجة 
المعلومات“ و ila,”‏ المعلومات“ فإنه غالبا ما ينظر [egal‏ بوصفهما مرادفين ' لتنظيم 
المعلومات“. وبينما يدل مصطلح ”معالحة المعلومات“ على كيفية معاملة المعلومات 
لأغراض الاسترجاع» فإن مصطلح ”إدارة المعلومات“ يتعلق بكامل الأنشطة 
المرتبطة بالمعلومات» من التقاط المعلومات حتى تنظيم المعلومات. 

ويستعمل مصطلح ”ثنظيم المعلومات“ في هذا الكتاب» لتغطية ختلف 
الحوانب والطرق الخاصة بإعداد البدائل sl surrogates‏ التمغيلات (كالكشافات 
والمستخلصات مثلا) لأغراض استرجاع المعلومات. 


استرجاع المعلومات: 
لقد حظي استرجاع المعلومات بالمعا AA‏ بطريقة أو أخرى» بوصفه مجالا 


موضوعياء يغطى كلا من جانبی تنظيم المعلومات واسترجاعها & (Spdrck Jones‏ 
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Willett, 1997)‏ كذلك يشار إلى الجانب الخاص بالاسترجاع بوصفه أيضا ”الوصول 
إلى المعلومات “information access‏ و“التاس المعلومات “information seeking‏ 
و ”الببحث عن المعلومات “information searching‏ ومن الممكن النظر إلى هذه 
المصطلحات بوصفها مرادفات Yc ple LU”‏ أن لكل منها توجهه old‏ فيا 
يتعلق بالمضامين؛ فمصطلح ”الوصول إلى المعلومات“ يركز على الجانب الخاص 
بتحصيل المعلومات أو الحصول عليها. by‏ مقابل ذلك يركز “التهاس المعلومات“ على 
المستفيد المشارك على نحو إيجابي في العملية. أما فيا يتعلق ' بالبحث عن المعلومات“ فإن 
تركيز الاهتمام يبدو منصبا على كيفية البحث عن المعلومات. 

وبالإضافة إلى المصطلحات التي سبق ذكرهاء فإن ”التنقيب عن البيانات 
“data mining‏ و “اكتشاف المصادر “resource discovery‏ غالبا ما نجدهما في لغة 
اختصاصبي المعلومات» في السنوات الأخيرة» عند مناقشة استرجاع المعلومات. 
doles‏ ما يستخدم كلا المصطلحين في إدارة الأعمال وبيئة المشابكة. ولازلنا الآن في 
انتظار ما إذا كان من الممكن لكل من ”التنقيب عن البيانات” و اكتشاف المصادر“ 
أن يتم استيعابها في اللغة المألوفة لمن ينتمون إلى SLE‏ استرجاع المعلومات. 

وهناك طبقة دلالية أخرى في استرجاع المعلومات» وهي ”اختزان المعلومات 
«information storage‏ الذي يتناول في المقام الأول» تسجيل المعلومات 
واختزانهاء إلا أن هذا الاستعمال في سبيله OY‏ يصبح تدريجياً من مارسات الماضي» 
نظرا لأن ”اختزان المعلومات“ لم يعد يشكل هما ذا بال» وذلك بفضل التطورات التي 
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حدثت في تقنيات اختزان المعلومات والوصول إليها. ولمذاء فإن استرجاع 
المعلومات» في هذا الكتاب» يشمل السعي وراء المعلومات. أو التماس المعلومات» 
والبحث عن المعلومات» والوصول إلى المعلومات» إلا أنه يستبعد اختزان المعلومات. 


العصر الرقمي: 

لكلمة “رقمي “digital‏ مقارنة بكلمة ”تناظري “analog‏ مفهوم حديث 
نسبيا؛ فكل من ”رقمي“ و ”تناظري“ مصطلحان يتصلان بالتقنيات الإلكترونية 
وفقا للتقرير التالي الذي قدمته تك تارجت )2001( Tech Target‏ وهي شركة 


تعرّف Laf‏ بالمصطلحات في تقنيات المعلومات: 


يدل رقمي على التقنيات الإلكترونية التي تولّد وتختزن 
وتعالج أو تجهز البيانات في حالتين: إيجابية وغير إيجابية. ويتم 
التعبير عن الإيجابية أو تمثيلها بالعدد CV)‏ بينا يتم التعبير عن غير 
الإيجابية أو تمثيلها بالعدد (صفر). ومن ثم» OB‏ البيانات التي يتم 
نقلها أو اختزانها بالتقنيات الرقمية» يتم التعبير عنها كسلسلة من 
الأصفار والآحاد ... وفيا قبل التقنيات الرقمية» كان isl‏ 
الإلكتروني يقتصر على التقنيات التناظرية» التي تنقل البيانات في 
شكل إشارات إلكترونية متفاوتة التردد أو النطاق» تضاف إلى 
موجات حامل تردد معين. وكانت الإذاعة والنقل tll‏ 


يستعملان تقليديا 233 تناظرية. 
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ومع ظهور الحاسبات والإنترنت وتقنيات المعلومات الأخرى» بدأنا ندخل 
بجلاء؛ العصر الرقمي. وهناك تزايد في ختلف الأنشطة» التي تشمل البحث 
والتطوير المتصلة بتنظيم المعلومات واسترجاعهاء التي تتم في البيئة الرقمية. ومن ثم 
فإن هذا gall lei‏ د ALD Le oll to‏ ي الو Zi peal al aad‏ 
بالنسبة للمجال. 


التكونات الف 

من لمكن تقسيم تنظيم المعلومات واسترجاعها برمتة إلى عدة عناصر ريسة: 
وهي مراصد البيانات» وتقنيات البحثء واللغة» وواجهة التعامل. والبشر (بمن فيهم 
المستفيد» واختصاصي المعلومات؛ ومسئول تطوير النظم)» والمعلومات» والنظم . 
. عناصر ثلاثة مترابطة» تعمل معا في قطاع تنظيم المعلومات واسترجاعهاء على الرغم 
من أنها لا تحظى بالمناقشة على وجه التحديد في هذا القسم. 
مراصد البيانات: 

تشكل مراصد البيانات أو قواعد البيانات databases‏ في تنظيم المعلومات 
واسترجاعهاء المعلومات التي يتم التعبير عنها أو تمثيلها وتنظيمها بطريقة معينة. 
وبالمعنى التقليدي يتكون مرصد البيانات (كمرصد البيانات على الخط المباشر على 
سبيل المثال) عادة من تسجيلات erecords‏ يتم تقسيمها إلى حقول fields‏ وهي 
أصغر الوحدات وأقربها للطبيعة» بالنسبة لفرز المعلومات والبحسث عنها 


71 


واسترجاعها؛ ففي مرصد بيانات مقالات الدوريات» على سبيل المثال» يشكل المؤلف 
والعنوان حقلين. وتتكون مراصد البيانات التقليدية من قسمين؛ ”الملفات التسلسلية 
“sequential files‏ و ”الملفات المصنفة أو المقلوبة “inverted files‏ والمللف 
التسلسلي هو مصدر مرصد البيانات؛ إذ ينشتمل على المعلومات منظمة في بنيان 
المرصدء القائم على الحقل والتسجيلة. ويسمى بالملف التسلسلي لأن ما يشتمل عليه 
من تسجيلات» ترد مرتبة وفقا للتسلسل الذي تتخذه عند إدخاها في مرصد البيانات. 
أما الملف المصئف أو المقلوب» ويعرف أيضا بالكشاف» فيكفل الوصول إلى المللف 
التسلسلي» بناء على استفسارات بحث معينة. ويسمى بالملف المقلوب نظراً لأن 
الترتيب الذي يتم به تمثيل المعلومات (نقطة الوصول access point‏ أولا ومحدد 
المكان ثانيا) عكس الترتيب في الملف التسلسلي (حيث محدد المكان locator‏ أو لا 
ونقطة الوصول ثانيا). 

وبالمعنى غير التقليدي» يمكن لمرصد البيانات (كما في نظم استرجاع الإنترنت 
على سبيل المثال) أن تكون به ملفات تسلسلية وملفات مقلوبة. إلا أن تكوين الملف 
التسلسلي لنظام استرجاع الإنترنت» على سبيل مشال» يختلف عم يناظره في النظم 
التقليدية لاسترجاع المعلومات (كنظم الخط المباشر مثلا)؛ إذ لا يتخذ تكوين الملف 
التسلسلي شكل مرصد البيانات القائم على الحقل والتسجيلة؛ حيث يتكون هذا الملف 
من معلومات بلا حقول» يتم التعبير عنها بصيغ أشبه بالنثر proselike‏ يضاف إلى 
ذلك أن المعلومات المتضمنة في هذا الملف» ليست بدائل (كالمستخلصات مثلا) وإنما 


أجزاء من المحتوى الكامل لإحدى وثائق الإنترنت الأصلية (كصفحة العنكبوتية 
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webpage‏ على سبيل المثال). إلا أنه في النظم التقليدية لاسترجاع المعلومات» عادة ما 
تكون المعلومات في الملفات التسلسلية ضربا من التمثيل في شكل توصيفات وراقية» 
ومستخلصات» وملخصات» ومقتطفات» وما شابه ذلك. 

ويحدد محتوى مرصد البيانات وتغطيته» ما يمكن أن يتم استرجاعه فيا بعد 
من نظام استرجاع المعلومات. 
تقنية البحث: 

لا يمكن البحث عن المعلومات التي يتم تمثيلها وتنظيمها نسقيا في مرصد 
البيانات» واسترجاعها إلا عندما تتوافر تقنية بحث مناظرة. ويمكن لتقنية البحث أن 
تكون على أي درجة من التطور» من حيث قدرات البحث» التي تتحدد معالمها في النهاية» 
كخوارزميات البحث» والإجراءات التي ينطوي عليها نظام استرجاع المعلومات. ومن 
الممكن لجميع إجراءات البحث» أن تصنف بوصفها أساسية أو متطورة. وعادة مانجد 
إجراءات البحث الأساسية في معظم نظم استرجاع المعلومات العاملة؛ بين) يتم اختبار 
إجراءات البحث المتطورة» وإجراء التجارب عليها في المختبرات» أو نماذج التنظيم الأولية 
prototype‏ في المقام الأول. إلا أنه يتزايد في السنوات الأخيرة ربط خوارزميات البحث 
المتطورة تكامليا بنظم استرجاع الإنترنت. 

وتنتمي الإجراءات» كالبحث بالكلات المفتاحية» والبحث البوليني» والبتر 
01 والبحث بالتقارب proximity‏ لمنظومة خوارزميات البحث 


الأساسية. وكا سبق أن أشرناء فإنه غالبا ما تشكل هذه الإجراءات تقنيات البحث 
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الكامنة في كثير من نظم استرجاع المعلومات. ومن الممكن للمستفيدين النهائيين من 
محدودي التدريب وخبرات البحثء أن يكونوا قاذرين على إنجاز مهام البحث 
البسيطة؛ في بيئات الاسترجاع من هذا الضرب. وتستخدم تقنيات البحث المتطورة» 
كالبحث بالوزن» في غالب الأحيان» في نظم الاسترجاع الأحدث» التي يتم تصميمها 
بوجه عام لأولئك الحاصلين على تدريب مهني» المتمرسين في البحث. 

وتحدد قدرات تقنية البحثء ما يمكن أنه يتاح من أساليب الاسترجاع 


للمستفيدين» وكيف يمكن استرجاع المعلومات المختزنة في مراصد البيانات. 
اللغة: 


تعتمد المعلومات على اللغةء المنطوقة أو المكتوبة» عندما يتم تجهيزهاء أو نقلها 
أو التواصل بها. واللغة في هذا السياق أحد المكونات الجوهرية في تنظيم المعلومات 
واسترجاعها. ومن الممكن للغة في تنظيم المعلومات واسترجاعهاء أن تكون لغة 
طبيعية أو لغة مقننة controlled vocabulary‏ ويسمى ما يستعمله البشر على نحو 
طبيعي للتعبير عن المعلومات أو صياغة الاستفسارات» ”لغة طبيعية natural‏ 
lly. “language‏ ما استخدمت لغة اصطناعية» محدودة المفردات» والنظم «syntax‏ 
والدلالة» والسياقات» في التعبير عن المعلومات واسترجاعهاء فإن تلك اللغة تسمى 
“اللغة المقيدة .(Wellisch, 1995) “controlled vocabulary‏ وهناك ثلاثة أشكال 
مألوفة للغة المقيدة» وهي خطط التصنيف» وقوائم رؤوس الموضوعات. والمكانز 
514+ ولكل منها وجه الاستخدام المخقاص بهاء في تنظيم المعلومات 
واسترجاعها. 


74 


وتكفل اللغة الطبيعية» بوجه cele‏ أعلى درجات التخصيص والمرونة في تنظيم 
المعلومات واسترجاعها. ولا يحتاج الإنسان إلى أي تدريب أو تمرين في استخدام اللغة 
الطبيعية؛ EY‏ هي اللغة التي نستخدمها للتواصل الشفوي أو التحريري يؤميا. وفي 
مقابل ذلك» فإن ابتكار اللغة المقيدة وصيانتها أمر باهظ التكلفة» atts‏ يتعين على 
المرء أن يتعلم كيف يستخدم مثل هذه اللغة بالممارسة والتدريب. إلا أنه بإمكان اللغة 
المقيدة الحد من المشكلات الحوهرية intrinsic‏ المرتبطة باللغة (كالتعقد» والفروق 
الدقيقة csubtleness‏ والغموض) عند استعمال اللغة الطبيعية لأغراض تنظيم 
ا معلومات واسترجاعها )1994 (Lansdale & Ormerod,‏ ولقد كان الجدل في هذا 
المجال حول اللغة الطبيعية في مقابل اللغة المقيدة» محتدما منذ iole‏ القرن العشرين 
(Rowley, 1994)‏ إلا أن اللغة تظل عنصرا جوهريا في تنظيم المعلومات 
واسترجاعهاء أيا كان ما ينتهي إليه الجدل. 

فاللغة» إلى حد ماء تحدد مدى المرونة والاصطناعية في تنظيم المعلومات 
واسترجاعها. والفصل الرابع في هذا الكتاب مكرس لناقشة اللغة في تنظيم المعلومات 


واسترجاعها. 


واجهة التعامل: 

واجهة التعامل cinterface‏ ک| ذهب شو )1991( Shaw‏ هى ما يراه المستفيدء. 
ويسمعه» ويلمسه عند التعامل مع نظام الحاسب. وتدل واجهة التعامل» في تنظيم 
٠‏ المعلومات واسترجاعهاء على التفاعل الذي يتم بين المستفيد والأنشطة المنصلة به. 
ومع هذا المكون في تنظيم المعلومات واسترجاعها أيضاء يبدو ما يتصل بالمستفيد 
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واضحاء وإن كان متداخلا مع المكونات الثلاثة الأخرى» وهي مرصد البيانات» 
وتقنية البحث» واللغة. 


ودائما ما ينظر في واجهة التعامل عند الحكم ما إذا كان نظام معالجة المعلومات 
واسترجاعها متعاطفا مغ المستفيد user-friendly‏ وکا تم تعريفها في قانون مورزء 
فإن النظم المتعاطفة مع المستفيد» من شأنها أن تجتذب أعدادا من البشر أكثر ما تجتذب 
النظم المعادية للمستفيد user-hostile‏ من حيث الاستخدام. وتتحدد جودة واجهة 
التعامل بطريقة التفاعل (كالاختيار من قائمة الخيارات menu‏ فعلا) وخصائضن 
العرض (كإخراج الشاشة وشكل الحرف مثلا) والعوامل المتصلة الأخرى. وقدبداً 
استغلال التقنيات التكيفية والمؤثرة» في تصميم واجهات التعامل وتنفيذهاء حيث 
يتجه المزيد من الاهتمام نحو البعد الإنساني في تنظيم المعلومات واسترجاعها. 
وتتحكم واجهة التعامل في النجاح النهائي للنظام بالنسبة لتنظيم المعلومات 
واسترجاعهاء وخصوصا إذا ما كان النظام يعمل في البيئة الرقمية. 

وقصارى القول» فإن مرصد البيانات» وتقنية البحث. واللغة» وواجهة 
التعامل تشكل المكونات الأساس لتنظيم المعلومات واسترجاعهاء على النحو الذي 
يتفاعل مع البعد الإنبساني» في مرحلة أو أخرىء أثناء عملية تنظيم المعلومات 
واسترجاعها. 


المشكلة الجوهرية في تنظيم المعلومات واسترجاعها: 
لا تزال المشكلة الجوهرية في تنظيم المعلومات واسترجاعهاء هي كيف يمكن 


الحصول على المعلومات المناسبة للمستفيد المناسب» في الوقت المناسب» على الرغم 
من وجود متغيرات أخرى (كخصائص المستفيدين أو حدود تغطية مراصد البيانات 
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مثلا) في بيئة تنظيم المعلومات واسترجاعها. وقبل الاستطراد في استكشاف المشكلة 
الجوهرية» ينبغي النظر أولا في عملية تنظيم المعلومات واسترجاعها. 


عملية تنظيم المعلومات واسترجاعها: 

في عملية تنظيم المعلومات واسترجاعهاء يشرع المستفيد في عملية الببحث» 
ويتلقى أي نتائج يتم استرجاعهاء lay‏ يعد اختصاصي المعلومات مسئولا عن تصميم 
نظم استرجاع المعلومات وتنفيذها وصيانتها. ويوضح الشكل رقم ١/١‏ عملية تنظيم 
المعلومات واسترجاعها. | 

وينبغي لأي'معلومات يتم استرجاعها من مرصد البيانات» أن يتم تمثيلها أو 
التعبير عنها أولا من جانب اختصاصي المعلومات» وفقا للغة التي وقع عليها الاختيار 
لأغراض تنظيم المعلومات واسترجاعها. ومن الممكن أن تحدث بعض مظاهر 
التفاوت في أثناء التعبير عن المعلومات» ومن الممكن أن تكون هناك مشكلات 
عويصة: إذا ما استخدمت لغة مقيدة» وذلك للأسباب التالية: أولاء عندما يتم التعبير 
عن المعلومات المسجلة في أوعية كمقالات الدوريات أو التقارير التقنية» في شكل 
مستخلصات أو مصطلحات كشفية» وما شابه ذلك» فإن استعادة المعلومات الأصلية 
لطبيعتهاء لا تبدو قابلة للتحقيق. ويمكن القول جدلا بأننا نمثل» على سبيل المثال» 
دائرة كبيرة بدائرة صغيرة» فإذا حدث AUS‏ فإن بعد الحجم يكون قد تم تشويهه. 
ثانياء إن أي لغة مقيدة جرد de gat‏ فرعية من اللغة الطبيعية التي كتبت بها الوثائق 


الأصلية؛ وهذا فإنه غالبا ما يكون من الصعب أن نجد» على سبيل JEL‏ تطابقا تاما 
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أو مضاهاة دقيقة بين مصطلح في وثيقة cle‏ وواصفة مستقاة من مكنز ما. ولأغراض 
التمثيل أو التنظيم فإنه يمكن للمكشف حينئذ» أن يختار من المصطلحات المتصلة» 
تلك المصطلحات الأضيق أو الأكثر اتساعاء الواردة في المكنز. LIE‏ يبدو عدم 
الاطراد في التعبير عن المعلومات (بما في ذلك تحليل المفاهيم) أمرا لا مفر منه» 
وخصوصا إذا كان هناك أكثر من شخصء أو أكثر من نظام يعالج المهمة. وقد سجل 
كلفردون )1984( Cleverdon‏ أنه حتى Oly‏ كان هناك مكشفان متمرسان» 
يستخدمان اللغة المقيدة نفسهاء [ald‏ يمكن أن يتفقا معا على تخصيص "١‏ بالمئة فة ط 
من المصطلحات للوثيقة نفسها. وعلى النحو نفسه. تبين لهمفري Humphrey‏ 
(1992). أن ol bY‏ فيا بين المكشفين في المدلاين MEDLINE‏ في اختيار 
yee‏ من قائمة رؤوس الموضوعات الطبية Medical Subject Hedings‏ 


LL 54 كان أقل من‎ (MeSH) 


ومن ناحية أخرى» يطلب من المستفيدين تحويل احتياجاتهم المعلوماتية» 
باستخدام لغة تنظيم المعلومات واسترجاعها التي يقع عليها الاختيارء إلى 
استفسارات يمكن بعدئذ تنفيذها في مرصد البيانات» بتقنية البحث المتوافرة. ولقد 
كان الباحثون منذ زمن بعيد» على دراية بالتعقد الذي يكتنف هذه المهمة؛ فقد أشار 
بلير ومارون )1985( «Blair and Maron‏ على سبيل المثال» إلى ”أنه من الصعب إلى 
حد الاستحالة بالنسبة للمستفيدين» أن يتكهنوا بالكليات وتجميعات الكلمات» 
والعبارات التي تستعمل من جانب جميع (أو معظم) الوثائق ")295 (P.‏ 
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الشكل رقم ١ /١‏ عملية تنظيم المعلومات واسترجاعها 


يضاف إلى ما سبق أن أي استعمال للغات المقيدة» ومقومات البحث 
(كالمعاملات البولينية مثلا) من شأنه أن يضاعف الصعوبة. والبحث في اللغة 
الطبيعية» أي البحث بالعبارات أو الجمل ALS‏ كا تستعمل في التواصل اليومي» 
دون صياغة أي استفسارات مقننة كالما السماء زرقاء؟ مثلا) في سبيله ON‏ يكون 
متاحا على الإنترنت» إلا أنه لا يزال هناك طريق طويل ينبغي أن يقطع» لكي يحقق 
الباحثون في معالجة اللغة الطبيعية» أحد أفرع الذكاء الاصطناعي AD‏ اختراقات 

وبعبارة أخرى» فإن إمكان نجاح عملية بحث ما أو عدمه يتوقف فقطء على ما 
إذا كانت هناك مضاهاة بين المعلومات التي تم التعبير عنها في كل من النظام 
والاستفسار الذي يقدمه المستفيد. ولكي نكون أكثر تحديداء فإن عملية البحث يمكن 
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أن تكون ناجحة» إذا كان هناك تطابق تام أو مضاهاة» بين الاستفسار والمعلومات 
التي تم التعبير عنها أو تمثيلها في مرصد البيانات» الذي وقع عليه الاختيار للمهمة. 
وما م يكن الأمر كذلك» فإن عملية البحث لا يمكن أن تسفر عن أي نتائج مفيدة. 
ولهذا فإن المضاهاة هي التقنية الأساس في تنظيم المعلومات واسترجاعها. وكما يتبين 
من الشكل رقم /١‏ ١ء‏ فإن هناك عدة نقاط في عملية تنظيم المعلومات واسترجاعهاء 
يمكن أن تكون وراء مظاهر التفاوت أو التضارب في المضاهاة. ولا يتحقق Gad)‏ 
النهائي لحودة تنظيم المعلومات واسترجاعهاء إلا من خلال استعال مختلف الطرق 
والأساليب» وذلك للحد قدر الإمكان أو التخلص كلية» من مظاهر التفاوت أو 
التضارب التي يمكن أن تحدث أثناء العملية. ونناقش هذه الطرق والأساليب تفصيلا 


فيا يأتى من فصول. 


أوجه القصور في تنظيم المعلومات واسترجاعها: 

في الوقت الذي أجريت فيه أعداد هائلة من البحوث في تنظيم المعلومات 
واسترجاعهاء لا تزال هناك أوجه قصور معينة يبدو من الصعب تخطيها. وحينا تأمل 
سو انسون )1988( Swanson‏ الموقف بالنسبة للتكشيف والاسترجاع الآليين» استعار 
مصطلح مسليات العجز postulates of impotence (PIS)‏ من إي. تايلور هويتكر 
»E. Taylor Whittaker‏ وصاغ تسع مسليات عجزهء تبين الأشياء التي لايمكن أن 
تتم في تنظيم المعلومات واسترجاعها. وعلى الرغم من حدوث ذلك عام ۱۹۸۸ء LB‏ 
يتعلق بالمجال الآلي» فإن هناك عدة عبارات لا تزال تبدو مناسبة» ونقتبسها هنا: 
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مسلمة العجز :١‏ لا يمكن الإعراب عن الحاجة إلى المعلومات كاملة كطلب 
بحث... فالسؤال لا يمكن أن يصاغ Bay‏ إلا بعد العثور على الإجابة. 


مسلمة العجز 7:... الصلاحية ليست ثابتة» lily‏ يتم الحكم عليها في حدود 


إطار متغير. 


مسلمة العجز 5: لا يمكن مطلقا التحقق مما إذا كانت جميع الوثائق الصالحة 
لأي طلب قد تم العثور.عليها... 

مسلمة العجز 4: قصارى القولء. أن المسلمات الثاني الأوليات تعني أن 
التكشيف والاسترجاع الآليين الكاملين الفعالين باطرادء ليسا من المستحيلات. 
والمشكلات المفاهيمية لاسترجاع المعلومات» أي مشكلات المعنى أو الدلالة» ليست 
أقل عمقا من التفكير أو أي أشكال أخرى للسلوك الذكي (96 AP.‏ 

والمشكلات المفاهيمية لاسترجاع المعلومات» كما عير عنها سوانسون 
7-» حاسمة بالنسبة PUU‏ بالمجال وتطوره. ويتضح من إمعان النظر في عملية 
تنظيم المعلومات واسترجاعهاء أن ما يتضمنه هذا النشاط» |S‏ سبق أن بيناء lel‏ هو في 
الأساس مضاهاة المصطلحات. وليس البحث عن المفاهيم في البيئة الرقمية؛ فعندما 
يكون مصطلح عملية البحث» على سبيل المثال ”النقل العام public‏ 
Of “transportation‏ الوثائق المكشفة تحت “LL”‏ أو ”مترو الأنفاق“ لا 
يمكن أن تسترجع» مالم يتم إعداد إحالات في اللغة المقيدة. هل يمكن لتنظيم 
المعلومات واسترجاعها أن يتجاوز Le gy‏ ما حدود مضاهاة المصطلحاتء ويقترب أكثر 
من البحث عن المفاهيم؟ ويتم البحث عن الإجابة واستكشافها ior‏ عن طريق 
التجربة (Swanson, 1977) hs‏ 
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الفصل الثاني 
تنظيم المعلومات - الطرق الرئيسة 


تحتاج المعلومات المسجلة رسمياء في مختلف أنواع الوثائق (كبحوث المؤتمرات» 
والتقارير التقنية على سبيل المثال) OY‏ يتم تنظيمها لكي يكون من الممكن استرجاعها. 
ولا يمكن بحال أن يتم استرجاع المعلومات بالوثائق الأصلية نفسهاء وإن| تتم عملية 
الاسترجاع ببدائل الوثائق» في شكل كشافات» ومستخلصات» وملخصات» وما شابه 
ذلك. ويدل التنظيم في هذا الكتاب على الجوهر أو المحتوى الموضوعي للوثائق 
بواسطة طرق معينة» وذلك على الرغم من أن الناتج النهائي يمكن أن يتخذ أشكالا 
مختلفة. وينبغي في الظروف المثالية» أن تتم عملية التنظيم ببساطة وكفاءة» إلا أنه كما 
لاحظ لسك )1997( ‘Lesk‏ 


إذا كانت لدينا خطة واحدة لتنظيم المعرفة» تكفل لنا وضع 
كل فكرة في مكان واحد» وإذا كان المستفيدون على دراية oiy‏ 
الخطة» وبإمكانهم وضع أي من استفساراتهم في إطارهاء فإن 
الاسترجاع ال موضوعي يمكن أن يكون واضح المعالم... ولا يبدو 
عملياء من الممكن لأي خطة لتنظيم المعرفة» أن تخدم جميع 
الأغراض )99-100 (pp.‏ 
وفضلا عن ذلك» Of‏ الطريقة التي يمكن أن تستخدم بها خطة التنظيم» على 
نحو مطرد ودقيق» تثير تحديات لاختصاصيي المعلومات» حتى وإن كان اختيار 
الخطط لا يشكل هما. كما أن بعض الطرق (كالاستخلاص مثلا) لا تتطلب خطة لكي 
يتم تنفيذهاء فتنظيم المعلومات إطار يعني التحدي والتعقد والفروق الدقيقة. 
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لقد كان التكشيف من الطرق التي تستخدم عإن نطاق واسع لتنظيم 
المعلومات. ويستخدم التكشيف المصطلحات (أي OLS!‏ أو العبارات) سواء كانت 
هذه المصطلحات مستقاة أو مشتقة من النصء أو معينة للنص» وذلك للتعبير عن 
الجوانب المهمة للوثيقة الأصلية. ويتراوح عدد المصطلحات الكشفية» التي تستعمل 
للتعبير عن محتوى وثيقة ماء ما بين بضعة مصطلحات في مراصد البيانات الوراقيةء 
وعدة مئات في نظم النصوص الكاملة. 


ويشكل التحليل المفاهيميء وترجمة الوثيقة” التي يتم تكشيفها الجانب 
الفكري لعلمية التكشيف. ولكى نكون أكثر تحديداء فإن التحليل المفاهيمى في 


(*) حتى لا يثير استعمال كلمة "ترجمة'' في هذا السياق شيئا من اللبس أو الخموض» نود أن نوضح أن 
الترجمة لا تتم للوثيقة كاملة» وإنما لعناصر المحتوى الموضوعي التي وقع عليها الاختيار» وتأتي 
الترجمة في مرحلة لاحقة لهذا الاختيار؛ فجميع عمليات المعاللجة الموضوعية لأوعية المعلومات» 
سواء في التصنيف أو الفهرسة الموضوعية. أو التكشيف أو الاستخلاصء تمر بثلاث خطوات؛ 
أولاها الإحاطة» أي الإلمام بمختلف عناصر المحتوى الموضوعيء أي تكوين صورة شاملة كاملة 
لمحتوى الوثيقة. والخطوة التالية هي اختيار أو انتقاء عناصر المحتوى الموضوعي الأهم من 
غيرهاء والجديرة فعلا بالتنويه أو الإبراز» في ناتج التحليل الموضوعي» وتسمى هذه الخطوة 
الترجيح. ثم GE‏ خطوة الترجمة» أي تحويل الصورة التي ارتسمت في ذهن المسئول عن المعاللجة 
الموضوعية للعناصر الجديرة بالتنويه؛ إلى اللغة المستعملة في التعبير عن ناتج التحليل» سواء كانت 
هذه اللغة خطة للتصنيف» أو قائمة لرؤوس الموضوعات» أو مكنزا. ويمكن أيضا القول بأن 
LE‏ الموضوعية تمر بمرحلتين؛ الأولى هي التحليل» وتشمل الإحاطة والترجيح. والثانية هي 
الترجمة. راجع في ذلك: 
Lancaster, F.W. Indexing and abstracting in theory and practice.‏ (1) 
ed. London, Library Association, 2003.‏ ™3 
AY (1)‏ فردرك ولفرد. نظم استرجاع المعلومات. ط؟. ترجمة حشمت قاسم. 
القاهرة. مكتبة غريب» NAAN‏ 
)۳( لانكسترء فردرك ولفرد وآمي وورنر. نظم استرجاع المعلومات. ط". ترجمة 
حشمت قاسم. الرياض» مكتبة الملك فهد الوطنية» ٠۹۹۷‏ . 
(E)‏ حشمت قاسم. مدخل لدراسة التكشيف والاستخلاص. القاهرة» دار غريب .7٠٠١‏ 


58 


التكشيف ينطوي على التحقق من المفاهيم الرئيسة التي تحظى بالتغطية في الوثيقة 
وترجيح المفاهيم الجديرة بالتنويه» بينم يحوّل الجانب الخاص بالترجمة فعلا المفهوم 
الذي وقع عليه الاختيار» إلى مصطلحات كشفية اعتادا على لغة التكشيف» التي وقع 
عليها الاختيار سلفا. وسوف نناقش لغة التكشيف على وجه الخصوص» مع لغة 
الاسترجاع في الفصل الرابع. 
أنواع التكشيف: 

يتوقف نوع التكشيف عادة على الطريقة ة التي يتم d pat Le‏ على 
المصطلحات؛ فإذا كانت المصطلحات مقتطفة أو مستقاة من النص الأصل للوثيقة» 
فإنهيسمى التكشيف الاشتقاقي derivative‏ وقي مقابل ذلك» إذا كانت 
المصطلحات معينة assigned‏ للوثيقة فإنه يسمى التكشيف بالتعيين „assignment‏ 
ومن الممكن أيضا معاملة التكشيف الاشتقاقي بوصفه مرادفا BASS‏ الكلمات 
المفتاحية» نظرا OY‏ المصطلحات الكشفية يتم التقاطها مباشرة من الكلمات المفتاحية 
الواردة في النصء ولا يتم الرجوع إلى أي لغة مقيدة. وفي مقابل ذلك فإنه يتعين 
استعمال لغة مقيدة في التكشيف بالتعيين لضان استعمال المصطلحات الملائمة. 

وعادة ما تسمى المصطلحات الكشفية التي يتم تعيينها من لغة مقيدة» 
بالواصفات descriptors‏ وذلك على الرغم من أن اللغة المقيدة المستخدمة قد لا 
تكون مكنزا. وإذا كان المفهوم الذي يتم تكشيفه جديداء أو تصادف أن كان علا 
(كالسور العظيم مثلا) ولا يمكن العثور على مقابل له في اللغة المقيدة» فإنه يمكن 
إعداد محدد للهوية identifier‏ في التكشيف بالتعيين. وبعبارة أخرى» فإن محددات 
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ody gl‏ مصطلحات يعينها المكشفء ولكنها لا تستقى من لغة مقيدة. وكما سبق أن 
ذكرناء فإن المصطلحات التي يتم التقاطها في عملية التكشيف الاشتقاقي تسمى 
كلات مفتاحية. 

وأحيانا ما يسمى التكشيف دون الاعتماد على لغة مقيدة بالتكشيف الحر 
5b ,.(Fugmann, 1993)‏ التكشيف الحر بوجه عام في التكشيف الاشتقاقي. 
وغل النحو نفسه. فإن التكشيف بالتعيين عادة ما يتم باستخدام إحدى اللغات 
المقيدة. وكون الأمر يتطلب استخدام لغة مقيدة في التكشيف» من القضايا ا مغارة 
عبر السنين» ولا تزال المناظرة Lb gm‏ مستمرة. وبوجه عام» فإنه مع تزايد توافر 
المعلومات رقمياء يتراجع استخدام اللغات المقيدة في التكشيف. نظرا لعوامل الكم 
والكيف. 


التكشيف الآلي والتكشيف المعتمد على الآلات: 

من الممكن تقسيم جميع الأنشطة التي ينطوي عليها التكشيف إلى فئتين؛؟ 
الأنشطة الفكرية والأنشطة الآلية mechanical‏ وقد تناولنا الجانب الفكري 
للتكشيف في القسم ۲/ .١‏ أما الجوانب الآلية في التكشيف فتشمل في المقام الأول 
أنشطة كالترتيب الهجائي وصياغة المداخل الكشفية. وبين| يظل الجانب الفكري من 
التكشيف مهمة بشرية في معظم الأحيان» نظرا للوضع الراهن للبخث في الذكاء 
الاصطناعي» فإن عمليات التكشيف ذات الطابع الآلي» يمكن أن تتم على نحو yer‏ 


بالحاسبات. وإذا ما استخدمت الحاسبات في معالجة كل من الجوانب الآلية والفكرية 


90 


للتکشیف» يصبح هناك تكشيف LÌ automatic J‏ إذا ما استخدمت الحاسبات في 


العمليات التكرارية فقط في التكشيف» بينم| يتحمل المكشفون من البشر مسئولية 
الجوانب الفكرية للتكشيف» يصبح هناك تكشيف معتمد على الآلات „automated‏ 


ويبدو التكشيف الآلي» الذي يعرف أيضا بالتكشيف بواسطة الآللات 
umachine indexing‏ حلا له جاذبية» خاصة بالنسبة لمشكلة الاطراد والتكلفة 
المرتفعة المرتبطة بالتكشيف اليدوي. إلا أن الضعف الجوهري للتكشيف SV‏ يكمن 
في عجز الحاسب عن التعامل مع الجانب الفكري للتكشيف» إلا بمساعدة اللكشف 
البشري» dy‏ معظم الأحيان يكون أداء الحاسب أسوأ بكثير من أداء اختصاصي 
المعلومات. والسبب في ذلك واضح؛ فالحاسب لا يستطيع في الواقع التفكير» كما أنه 
لا تنوافر له القدرات التحليلية التي يتمتع بها الإنسان. وفي مقابل ذلك» يمكن 
للتكشيف الآلي إعفاء المكشفين البشر من مهام التكشيف التكرارية المرهقة» وبذلك 
يكون بإمكانهم التركيز على نحو CAST‏ على المهام الفكرية للتكشيف. 

ولا ينبغي» من ناحية أخرىء التهوين من قدر التكشيف الآلي» وخصوصا 
عندما تكون كميات المعلومات المراد تكشيفها ضخمة؛ إذ عادة ما يعتمد هذا الضرب 
من التكشيف على خوارزميات متعددة» من بينها تبدو طريقة إحصاء تردد الكلمات 
المفتاحية الأكثر شيوعاء وقد استخدمت فعلا بكثافة. وتستند طرق التكشيف JI‏ 
الأخرى بوجه ple‏ على تقارب الكلمات المفتاحية» وموقعهاء والاحتالات» 
والخصائص اللغوية. |S‏ تدخل اللغات المقيدة في بعض تطبيقات التكشيف Jv!‏ 
أيضاء إلا أن نجاح مثل هذه الطريقة يتأثر سلبا بالطابع الآلي للتكشيف الإلكتروني. 
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التكشيف في بيئة التنظيم الفائق 

يتزايد توافر المعلومات في بيئة التنظيم الفائق chyperstructure‏ التي تتمثل 
في العنكبوتية العالمية World Wide Web‏ وبالنسبة للمعلومات المعتمدة على 
العنكبوتية» فإنه من الطبيعي إلى أبعد حدء تقديم المصطلحات الكشفية بوصفها 
روابط فائقة chyperlinks‏ تتضمن كلا من المصطلحات الكشفية وتقنية تحديد المكان 
locator mechanism‏ وبعبارة ug Í‏ فإن أسماء الروابط الفائقة a‏ تقوم مقام 
المصطلحات الكشفية» حيث تقود طريقة الروابط الفائقة المستفيد iW‏ إلى حيث 
تشير المصطلحات الكشفية. وبالمقارنة ببيئات التكشيف الأخرىء فإن هذا النظام 
فريد من النواحي التالية: 

أولاء ترد المصطلحات الكشفية في بيئة التنظيم الفائق كامنة في ثنايا الوثائق 
نفسهاء وليست ككيانات منفصلة خارج السياق. ثانياء تندمج المصطلحات الكشفية 

وتقنية الوصول إلى المكان معا في وحدة واحدة» بدلا من ورودهما منفصلين. ثالشاء لا 

ينعكس التقسيم الحرمي الموضوعيء أو مفهوم المداخل الفرعية في التكشيف 
التقليدي» تماما أو بحذافيره في بيئة التنظيم الفائق. رابعاء لا يمكن النظر إلا للروابط 
القائمة على المحتوى» في التنظيم الفائق» بوصفها مصطلحات كشفية» بنا لا يمكن 
للروابط التنظيمية» ”كالصفحة التالية“ و ”رأس الوثيقة“ أن تعد كذلك (Chu,‏ 
(1997. خامساء ينهض المؤلفون بدور المكشف غندما يقومون بإعداد وثائق التنظيم 


الفائق» كا يتم التكشيف تزامنيا مع إنشاء الوثائق» إن لم يكن قبل ذلك. ويترتب على 
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ذلك احتمال BES‏ ورود مصطلحات (من قبيل ”اضغط هنا“ على سبيل المثال) تلك 
المصطلحات التي لا يحتمل هما أن يقع عليها الاختيار من قبل المكشف» بوصفها أسماء 
روابط» في بيئة التنظيم الفائق. سادساء تراجع احتمالات التفاوت بين الوثائق الأصلية 
والمصطلحات الكشفية» في ظريقة تنظيم المعلومات هذه؛ نظرا لأن المؤلف هو من 
يقررء أثناء كتابة الوثيقة» أي المصطلحات ينبغي أن تصبح روابطهء بينا يحدث في 
التكشيف التقليدي أن يكتب المؤلف الوثيقة» ثم يحاول المكشف بعد ذلك تحليلها 
لأغراض التنظيم. 

ونظرًا للخصائص الفريدة للتكشيف في ty‏ التنظيم الفائق» فإن الوثائق الفائقة 
gm‏ کیت برقت مل اسل ا 
يختار أسماء الروابط بعناية» عند كتابة الوثائق الفائقة )1997 (Chu,‏ 


التميبز الاجتماعي: 

بدأ التمييز الاجتماعي social tagging‏ الذي يختلف قام الاختلاف عن 
التمييز بإحدى شفرات التحقق من الحرية identification code‏ (كالتحقق بالتردد 
اللاسلكي radio frequency identification - RFID‏ على سبيل المثال) يزداد 
Lt‏ وس وهاو die‏ ع shell dell E ddan g a‏ مق ابل 
”تكشيف“ المعلومات على الإنترنت. وينتمي التمبيز الاجتماعي» مرتبطا بالتطبيقات 
الأخر 5 الرامية إلى مشاركة المستفيد (كالتدوين blogging‏ والمواقع الجماعية على 
العنكبوتية (Wikis‏ إلى حركة الجيل الثاني للعنكبوتية 2.0 (O'Reilly, Web‏ 
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)2005 وتشمل النظم المبكرة المزودة بتقنية تمييز فلكر Flickr‏ وهو موقع شهير على 
العنكبوتية لتقاسم الصور !525 5.45 del.icio.us‏ الذي تغير اسم نطاقه إلى 
Delicious.com‏ عام Y e tV‏ ففي مثل مواقع التمييز هذه» يمكن للمرء أن يصف أو 
يعقب على ما يراه أو يسمعه. بتمييزه بكلمات أو عبارات من اختياره. 

والتمييز» إلى حد بعيد» نشاط مماثل لتكشيف الكلمات المفتاحية الذي سبقت 
الإشارة إليه في هذا القسم» إلا أن تكشيف الكلمات المفتاحية يتم إجراؤه بواسطة 
المكشفين» ومؤلفي الوثائق التخصصية» ونظم استرجاع المعلومات» بين يتم إجراء 
التمييز بواسطة أي مستفيد من الإنترنت. ونظرا لهذا الاختلاف الجوهري» فإن التمييز 
لا يبدو مقابلا لتكشيف الكلات المفتاحية» وإن كان من يارسونه taggers‏ يميلون 
لاختيار أساء أو عبارات اسمية كتيجان ctags‏ في معظم الأحيان ;2007 (Kipp,‏ 
Ku & Chu, 2008)‏ يضاف إلى ذلك وجود المشكلات التي يعاني منها تكشيف 
الكلمات المفتاحية (كالمترادفات» والمشترك اللفظي أو الجناس» وتعدد أشكال 
الكلهات» على سبيل المثال) جميعها في التمييزء إن لم تكن على نطاق أوسع. إلا أن 
للتمييز» كطريقة ناشئة وبديلة للتعبير عن المعلومات أو تمثيلهاء احتمالات عريضة في 
تيسير استرجاع المعلومات» نظرا OY‏ التيجان التي ينشئها المستفيدون» من بين مزاياها 
الأخرى (كتوفير المزيد من نقاط الوصول على سبيل المثال)؛ من المرجح إلى حد بعيده 
أن يتم اختيارها من قبل المستفيدين النهائيين أنفسهم كمصطلحات استفسار للعثور 
على المعلؤمات. 
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وكأسلوب ناشئ لتنظيم المعلومات أو تمثيلهاء حقق التمييز ابتكارات من شأنها 
إثراء JLE‏ استرجاع المعلومات )2008 (Smith,‏ والتصنيف المتعارف عليه 
folksonomy‏ من بين هذه الابتكارات. وقد سك توماس فاندر وال Thomas‏ . 
Vander Wal‏ كلمة folksonomy‏ عام ٠ ۰ ٤‏ 27 وهي تركيب مزجي من كلمتي 
folks‏ ر .(Vander Wall, 2007) taxonomy‏ ويعبارة أخرى فإن التصنيف 
المتعارف عليه folksonomy‏ تصنيف شجري أو هرمي taxonomy‏ قائم على 
التيجان التي ينشئها القوم folks‏ أو المستفيدون النهائيون. ويشتمل القسم ٤/٤‏ على . 
مزيد من المناقشة لكل من التصنيفات الشجرية والتصنيفات المتعارف عليها. وعادة ما 
تتخذ التصنيفات المتعارف عليها شكل حشد من التيجان ctag cloud‏ وهو تجمع من 
التيجان التي تنشأ في موقع تمييز cle‏ اعتمادا على الترددات المميزة. ويمكن لحشد 
التيجان أن يساعد المستفيدين في اختيار المصطلحات الملائمة سواء في عملية التمييز أو 
في عملية الاسترجاع. 


التقسيم الفئوي: 


يدل التقسيم الفنوي categorization‏ على التنظيم التسلسلي وال هرمي 
للمعلومات أو تمثيلها بفئات. ويمكن أن يكون هناك ضربان من التقسيم الفئويء تبعا 
U‏ إذا كانت هناك خطة نسقية متطورة مستخدمة أم لا. 


أنواع التقسيم الفئوي: 


عادة ما يتم التقسيم الفئوي وفقا لخطة تصنيف مستقرة» كتصنيف ديوي 
العشري (DDC)‏ وتصنيف مكتبة الكونجرس (LCC)‏ وتسمى تطبيقات التقسيم 
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الفئوي هذه على هذا النحو بوجه عام» بالتصنيف الذي يمكن أن يطبق على وجه 
العموم على مجموعات المكتبات ومرافق المعلومات. وتشمل رموز التصنيف الأرقام» 
أو الهجائيات» أو الأرقام الحجائية. 

ومع ظهور الإنترئت» نشر الكثير من المعلومات على هذه المنصة الجديدة. 
وتتقاسم المعلومات على الإنترنت بوجه عام الخصائص التالية» وهي: الطابع المؤقت 
أو سرعة الزوال ephemeral‏ والجودة المتفاوتة «mixed quality‏ والكميات 
الهائلة. ولهذا فإن طريقة التصنيف تبدو باهظة التكلفة» أو غير ملائمة» أو غير مجدية 
لتنظيم المعلومات أو تمثيلها على الإنترنت» بين يبدو التقسيم ال حرمي أو الشجري 
القائم على فئات غير محكمة البنيان» الإطار المناسب لتنظيم المعلومات من هذا الطابع. 
وياهو! Yahoo!‏ ولاشك» رائد في هذا المجال» إذ أصبح أنمو ذجا لتنظيم المعلومات 
أو تمثيلها على الإنترنت» وعلى العنكبوتية العا مية على وجه ا لخصوص. وترد الفئات في 
التصنيفات الشجرية من أجل تنظيم المعلومات المعتمدة على العنكبوتية» أو تسجل 
مباشرة بوصفها روابط فائقة. ولا تستخدم أي رموز notations‏ (كالأرقام أو 
Obstet‏ أو الأرقام ال هجائية مثلا) للدلالة على العلاقات الشجرية أو غيرها في إطار 
التصنيف. ونقدم المزيد من التغطية للتصنيف في الفصل الرابع» إلى جانب مناقشة 
التصنيفات المتعارف folksonomies te‏ والتصنيفات التخصصية „ontologies‏ 


أسس التقسيم الفئوي: 


عندما يقع الاختيار على التقسيم الفئوي» كطريقة لتنظيم المعلومات أو تمثيلهاء 
يتم تخصيص فئة واحدة أو فئتين أحيانا للعناصر التي تغطي موضوعات بينية أو 


متعددة الارتباطات Jinterdisciplinary‏ وئيقة معينة. وبعبارة أخرى» فإن وثيقة 
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بعينها ينبغي أن تعين لفئة محددة واردة في النظام القائم للتقسيم الفئوي. ويتطلب ذلك 
أن تكون الفئات التي وقع عليها الاختيار لنظام التقسيم الفئوي في الوقت نفسه: 
© شاملة .Exhaustive‏ 


.Mutually exclusive قائمة بذاتبا‎ © 


ويقصد هنا القول بأن جميع الفئات التي يمكن أن تدعو الحاجة إليها لتنظيم 
المعنومات أو تمثيلهاء ترد في نظام التقسيم الفئوي. ولا ينبغي في الوقت نفسه لأي من- 
هذه الفئات أن تكون متداخلة [eb‏ بينها. وما لم يتوافر الشرط الأول فإنه لن يكون من 
الممكن التعبير عن بعض المعلومات أو تنظيمها بالفئات المتاحة في الخطة. وما لم يراعى 
الشرط الثاني فإنه يمكن حينئذ اختيار أكثر من فئة واحدة لتمثيل الوثيقة الواحدة. 
ومن شأن أسس أخرى كالمرونة مثلاء أن تيسر الاستخدام. وعلى الرغم من أهمية 
المرونة» فإنها ليست جوهرية كهذين الأساسين السابقين. 
اندماج طريقتي التقسيم الفئوي: 

يكمن ما يميز Uf‏ من طرق التقسيم Gp till‏ عن غيرهاء في المقام الأول» في 
طبيعة الإطار المتبع لأغراض تنظيم المعلومات أو تمثيلها. فقد أكد التصنيف» وقد 
صمد لأنواع متعددة من الاختبارات» مكانته كطريقة بارزة لتنظيم المعلومات. أما 
التقسيم الشجري» فعلى العكس؛ إذ ينظر إليه بوصفه طريقة سريعة غير ناضجة 
لتنظيم المعلومات. ومع تزايد توافر المعلومات المهمة الجيدة على الإنترنت» بدأ 
التصنيف يستخدم للتقسيم الففوي للمعلومات المعتمدة على الشبكة 
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McKierman, 2001)‏ على سبيل المثال). وفي الوقت نفسه تم تنقيح الأطرء 
وتطويرها لأغراض التقسيم الشجري والارتقاء بهاء بإدخال الخصائص التي صمدت 
لاختبار الزمن» تلك الخصائص التي نشأت في كنف خطط التصنيف» كالتنظيم أو 
التقسيم الشجري. 

وفضلا عن ذلك» تزايدت جهود استكشاف التقسيم الفئوي للنصوص 
بالوسائل الآلية )1999 Boley, et al., 1998; Yang,‏ على سبيل (JUL‏ و ذلك 
بالاتجاه نحو التقسيم الشجري taxonomy‏ لا التصنيف classification‏ 3 
تزايد كم المعلومات التي تتاح رقميا. وبينم| اجتذب التصنيف DY)‏ يوما che‏ قدرا كبيرا 
من اهتمام الباحثينء فإن القدرات العقلية اللازمة للتصنيف المنضبطء تبدو صعبة 
التحقيق في الخوارزميات القائمة على الآلات دون سواها. 


التلخيص: 


على عكس التكشيف أو التصنيف أو التقسيم الفئوي» فإن التلخيص يحاول 
التعبير عن وثيقة ما أو تمثيلها بفقرة أو اثنين» أي بملخص أو شكل مركز للأصل. 
وتحدد درجة التركيز والطريقة التي تتبع معام الطرق المختلفة للتلخيص. 


(*) أيا كان المصطلح المستعمل للدلالة على التقسيم الفئويء فإن التقسيم الفئوي هو الأساس في 
ALLL‏ الموضوعية للوثائق أو أوعية المعلومات؛ فالترتيب الهجائي للمفردات تقسيم SB‏ 
والفهرسة الموضوعية تقسيم فتوي LEY‏ تؤدي إلى نشأة فئات من الوثائق أو أوعية المعلومات» 
وكذلك التكشيف. أيا كان شكله وتقنياته» تقسيم فئوي لأنه يؤدي أيضا إلى نشأة فئات» بما في 
ذلك تكشيف الاستشهاد المرجعي .citation indexing‏ (المترجم) 
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المستخلص abstract‏ تمثيل موجز دقيق لمحتوى الوثيقة. ولقدكان 
الاستخلاص» أي عملية صياغة المستخلصات. يتم أساسا بواسطة البشر» على الرغم 
من بذل بعض الجهود الآلية )1958 Luhn,‏ على سبيل (SLA‏ فيا مضى. 
فالمستخلصات ينبغي مثاليا أن تصاغ بأسلوب مماثل للأصلء إلا أن ذلك المعيار من 
الصعب الوفاء بهء نظراً للفقدان الذي لا مناص منه للأصالة أو الموثوقية» أثناء عملية 
الاستخلاص. | 
ومن الممكن أيضا تقسيم المستخلصات إلى ثلاثة أنواع؛ المستخلصات 
الإعلامية أو المعلوماتية informative‏ والمستخلصات الكشفية «indicative‏ 
والمستخلصات النقدية critical‏ وتشتمل المستخلصات المعلوماتية على المعلومات 
الجوهرية الواردة بالوثيقة الأصلية» ولهذا فإنها يمكن أن تقوم مقام البديل. واعتادا 
على المستخلصات المعلوماتية يمكن للمرء أن يقرر ما إذا كان بحاجة لأن يطلع على 
الوثيقة الكاملة. أما المستخلصات الكشفية Lep‏ يمكن في مقابل ذلك أن تصف 
”حيثيات أو محتوى “aboutness‏ الوثيقة الأصلية» مع استبعاد تفصيلات معينة 
كالمنهج والتتائج» ومن ثم LAB‏ لا يمكن أن تعامل بوصفها بديلا عن الأصل. وعلى المرء 
الاطلاع على الوثيقة الأصلية» للحصول على تصور شامل Lb‏ وتسمى المستخلصات 
النقدية على هذا النحو؛ نظرا لأنها لا تمثل محتوى الوثيقة موضوع الاهتمام فحسب» وإنما 
تحاول أيضا تقييم ذلك المحتوى. ولا يوصى بهذا الشكل من المستخلصات؛ نظرا لأن 
المستخلصات بطبيعتهاء ينبغي أن تخلو من أي تأويل أو تفسير أو أحكام. ولا ينبغي بوجه 
عام كتابة مستخلصات نقدية ما م يطلب من المرء ذلك.. 
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وكا سبق أن أشرناء فقد استكشف الباحثون طرق إعداد المستخلصات AJY‏ 
إلا أن الناتج النهائي يبدو الآن في جوهره» أقرب للملخصات الآلية أو المقتطفات 
الآلية» منه إلى المستخلصات الآلية» لأنه يتكون في المقام الأول» من جمل مفتاحية. 
مقتطفة أو مقتبسة من الوثائق الأصلية. 
الملخصات: 

الملخص إعادة صياغة للنقاط الرئيسة الواردة في الؤثيقة الأصلية» يرد في صدز 
الوثيقة أو في نهايتها. وعلى الرغم من قربه من المستخلص. فإن الملخص عادة ما يفترض 
أن القارئ سوف تتاح له الفرصة لإمعان النظر في الوثيقة الكاملة. ومن ثمء فإن هناك 
عناصر معينة» لا غنى عنها للاستيعاب الكامل للوثيقة» كالأقسام المتعلقة بالخلفيات أو 
المنطلقات» والمهدف» و المنهج» dole‏ ا تغيب من الملخص )1992 (Rowley,‏ 


ولقد تطورت خوارزميات لتلخيص النصوص آلياء وخصوصا تلك 
النصوص التي تتخذ الشكل الرقمي» في غضون السنوات القليلة الماضية ) Spiirck‏ 
Jones, 2007; Spirck Jones & Endres-Niggemeyer, 1995‏ على سبيل 
المثال». ويبرز التلخيص الآلي» في الواقع» بوصفه VLE‏ للبحث الجاري في الذكاء 
الاصطناعي (AD‏ ويمكن لبعض الباحثين تسمية منتجاتهم النهائيةء من البدائل أو 
التمثيلات بالمستخلصات. إلا أنه من المعروف ولاشك. أنه لا يمكن إلا للبحث في 
الذكاء الاصطناعي» أن يكون قادرا على أن يجعل من الاستخلاص JII‏ حقيقة 
dy daily‏ يتم تطوير خوارزميات الذكاء الاصطناعي هذه بنجاح. ونواصل مناقشة 
التخليص الآلي في القسم ۲/۲/۱۲. 
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المقتطفات: 

يتكون المقتطف extract‏ من جزء واحد أو أكثر من وثيقة ماء يتم التقاطه 
لتمثيل الكل. ولا يمكن للمقتطفات أن تكفل تمثيلا مناسبا للوثائق الأصليةء إلا أنبا 
يمكن أن تكون لما أهميتها بالنسبة للقارئ الذي متم بحصيلة أو خلاصة دراسة 
معينة. ولا يمكن بحال النظر إلى المقتطفات بوصفها بدائل للوثائق الأصلية. 

والمقتطفات» وإن كانت قدرتها التمثيلية أدنى من تلك الخاصة بكل من 
الملخصات والمستخلصات» من الممكن بناؤها كاملة بالطرق الآلية. وتستخدم معظم 
نظم استرجاع الإنترنت» بها في ذلك جوج لء مقتطفات آلية لأغراض JHE‏ 
المعلومات. ومن الخصائص السيئة للمقتطفات الآلية التي تنتجها نظم استرجاع 
الإنترنت» أن المقتطف عادة ما ينتهي بعلامات الحذف ellipsis‏ عندما يصل إلى نقطة 
التوقف off point‏ نه التي يحددها النظام. من ثم فإن جودة المقتطفات الآلية أمر 


يثير المخاوف أو لا يدعو للاطمئنان» عندما تستخدم لتمثيل الوثائق. 


ملخص الموقع الثري: 

آر إس إس RSS‏ الشكل المختصر الذي يقوم مقام ملخص الموقع الشري 
Rich Site Summary‏ تطبيق آخر للجيل الثاني للعنكبوتية العالمية 2.0 Web‏ 
يمكن أن يستخدم لأغراض ثيل المعلومات. وبمزيد من التحديد فإن ملخص 
الموقع الثري يعتمد على صيغ ملف يسمى ملقمات feeds‏ يقوم بتجميع المعلومات 
التي استجدت حديثا من عدة مصادر على العنكبوتية. وبإمكان ALA pI‏ الذين 
يشتركون في ملقمات معينة» عن طريق قارئ ما ol)‏ برنامج تجميع (aggregator‏ أن 
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يتلقواء على حاسباتمم» المعلومات التي تتيحها حديثاً هذه الملقمات. ومن ثم فإنه 
يمكن النظر إلى ملخص الموقع الثري بوصفه خدمة إحاطة جارية» في بيئة العنكبوتية 
العالمية» تقدم للمشتركين ملخصات للمعلومات التي تتاح حديثاء من المصادر التي 
Opar‏ بها. وبهذا المعنى يبدو ملخص الموقع الثري اسا ملائما هذا التطبيق. 

وإدراكا وتقديزا منهم لأهمية ملخص الموقع الثريء ابتكر أولئك الذين 
ينهضون بمهام في تجمع العنكبوتية العالمية (W3C) World Wide Web‏ 
«Consortium‏ طبعة جديدة من ملخص الموقع الشري» عندما أصبحت buns‏ 
Netscape‏ الشركة التي قامت بتطوير أول متصفح تصويري للعنكبوتية graphic‏ 
eweb browser‏ عاجزة عن دعم ملخص الموقع الشري الذي أنشأته من البداية. 
ونظرا OY‏ الطبعة الجديدة من ملخص الموقع الثري كانت تستند إلى المواصفة المعيارية 
المساة بإطار imo s‏ المصادر «Resource Description Framework (RDF)‏ 
التي وضعها تجمع العنكبوتية العالمية (W3C)‏ كجزء من الهندسة المعمارية للعنكبوتية 
الدلالية؛ تغير المختصر RSS‏ للدلالة على ملخص موقع آر دي إف RDF Site‏ 
Summary‏ لتمييزه عن سلفه ملخص الموقع الثري )2005 (Kelly,‏ والتوظيف أو 
التطبيق البسيط فعلا Really Simple Syndication‏ معنى آخر للشكل المختصر 
(RSS‏ تم تطويره بعد طبعة تجمع العنكبوتية العالمية Lerner, 2004) W3C‏ . 

ومقارنة بطرق التخليص الأخرى التي تناولناها في هذا القسم» فإن ملخص 
الموقع الثري يتم إنجازه آليا على العنكبوية. وتلبي هذه الخاصية الآلية على نحو ملائم؛ 
احتياجات كثير من المستفيدين النهائيين» الذين يرغبون في الاطلاع على أحدث 
المغلومات» من ناحيةء إلا أن جودة معلومات الملخص الذي يقدمه ملخص الموقع 
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الثري» من ناحية أخرى أدنى مستوى» ولاشك من معلومات طرق التخليص 
الأخرى. كالمستخلصات على سبيل المثال. والقدرة التمثيلية representativeness‏ 


أحد المعايير التي عادة ما تستخدم في الحكم على جودة التلخيص. 

قضية القدرة التمثيلية: 

جميع الأشكال الأربعة المختلفة للتلخيص. المستخلصات» والملخصات» 
والمقتطفات» وملخص الموقع الثري» وسائل معترف بها لتمثيل المعلومات. إلا أا كا ٠‏ 
مدق أن بيناء تختلف فيا بينها من حيث مدى التمثيل .Fepresentativeness‏ 
وبترتيب هذه الوسائل الأربعة بناء على هذا المعيار» يمكن للمستخلصات أن تتريع 
على القمة» بين| يبدو ملخص الموقع الثري متمتعا بأقل قدرة GALLE‏ هذه المجموعة. 
ويمكن للملخصات والمقتطفات أن ترد في مرتبة وسط بين الوسيلتين الأخريين. 
وعلى الرغم من إيجاز هذه المقارنة» فإنها تلقي بعض الضوء على سبل تطبيق أي من 
طرق التلخيص» على أفضل وجه. لمختلف مهام تمثيل المعلومات. 


الطرق الأخرى لتنظيم المعلومات: 
إذا ما نظرنا إلى التكشيف والتقسيم الفئوي والتلخيص» بوصفها طرقا تقليدية 
.لتمثيل المعلومات أو تنظيمهاء فإن الأساليب التي تحظى با مناقشة في هذا القسم فريدة 


وغير معيارية. 
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الاستشهادات المرحعية: 

الاستشهادات المرجعية citations‏ هي الإشارات أو الإحالات references‏ 
التي يسجلها المؤلفون عندما يؤلفون bled‏ ويدل الاستشهاد المرجعي بوجه ple‏ 
على وجود علاقة بين جزء من الوثيقة المستشهد بها أو كلهاء وجزء من الوثيقة التي 
يرد بها الاستشهاد أو كلها (1968 (Malin,‏ ومن ذ أن أدخل يوجين جارفيلد 
“Eugene Garfield‏ مؤسس obs glall ages‏ العلمية Institute for Scientific‏ 
Information‏ الذي ينشر كشافات الاستشهاد المرجعي «citation indexes‏ هذا 
النهج الجديد إلى Ske‏ تنظيم المعلومات واسترجاعهاء تركز قدر كبير من المناقشات 
عتل فك شقرة دلآللة ne Moles eI‏ أوالتحقق من ld‏ تسجيل 
الاستشهادات. وحاول جارفيلد عام ١٦۱۹ء‏ تلخيص أسباب تسجيل الاستشهادات 
المرجعية؛ في حمس عشرة نقطةء تشمل على سبيل المثال الإعراب عن الولاء للرواد 
والاعتراف بالأعمال ذات الصلة بالعمل الجديد )1965 (Garfield,‏ 


وعلى الرغم من أن الدافع الحقيقي للاستشهاد بأعمال الآخرين» قد يختلف من 
شخص لآخرء فإنه من الممكن النظر إلى الاستشهادات المرجعية» بوصفها ما يختاره 
المؤلفون الذين يسجلون الاستشهادات المرجعية» لتمثيله في bled‏ ويتخذ التمثيل 


(*) راجع أيضا في ذلك: 

٠‏ حشمت قاسم. كشافات الاستشهاد المرجعي وإمكاناتها الاسترجاعية. المجلة العربية 
للمعلومات» eT ee‏ ع4؛ يونيو VAA‏ وأعيد النشر في: حشمت قاسم. دراسات في علم 
المعلومات. ط۲. القاهرة» دار غریب» 2١9446‏ ص ص 707-170 

o‏ حشمت قاسم. تحليل الاستشهادات المرجعية وتطور القياسات الوراقية. المجلة العربية 
للمعلومات» Op Yora‏ ديسمبر .۱۹۸١‏ وأعيد النشر في: حشمت قاسم. دراسات في علم 
المعلومات. ط۲. القاهرة» دار غریب» 990 ص ص 117-/1517. 
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في هذا السياق شكل الاستشهادات المرجعية» لا البدائل العادية كالمستخلصات 
والمصطلحات الكشفية. والاستشهادات المرجعية» في الحقيقة معلومات وراقية 
(ببليوجرافية) حول الوثائق» يمكن تحليلها إلى عناصر كالعناوين وأس)ء المؤلفين. 
وبعبارة أخرى» فإن الاستشهادات المرجعية تكفل مصدراً ثرياً لتنظيم المعلومات. 
وفضلا عن ذلك لا تدعو الحاجة إلى ابتكار إطار (كالمكنز أو خطة التصنيف على سبيل 
المثال) لأغراض التنظيم» lee‏ لا يمكن الاستغناء عن مثل هذا الإطار في التصنيف 
. والتكشيف باللغات المقيدة“. 

والمؤلفون الذين يسجلون الاستشهادات المرجعية: إنها هم في الواقع يكشفون 
blesi‏ بمصادر متاحة بسهولة» وهي على وجه التحديد الإشارات أو الاستشهادات 
المرجعية. إلا أن الاستغناء عن الوسطاء في تكشيف الاستشهادات المرجعية» له آثآره 
الإيجابية والسلبية على تنظيم المعلومات أو تمثيلها؛ أما التأثير الإيجابي فهو أن المؤلف 
بو اکت يعرف عم له عل ان وت نولا متاح إل بن آي ج دا 
الوثائق الأصلية؛ وأما التأثير السلبي فهو أن المبرر الحقيقي للاستشهاد ا غير 
معروف في الواقع. وهذا فإننا يمكن أن نتساءل دائم| ما إذا كانت الاستشهادات 
المرجعية المناسبة قد استخدمت فعلاً لتمثيل وثيقة ما. وهناك داع آخر لأن نتخوف من 
تكشيف الاستشهادات المرجعية بوصفه طريقة لتنظيم المعلومات» وهو قصور تغطية 
مراصد بيانات الاستشهاد المرجعي. فالباحثون عادة ما يقيدون من مثل هذه المراصد» 
OY‏ إعداد مرصد من الصفر غالبا ما يبدو أمزا غير عملي ومبدداً للوقت إلى حد بعيد. 


(*) ربها كان من الممكن هنا القول Ob‏ هناك فتتين من طرق تنظيم المعلومات؛ الطرق الصريحة 
Explicit‏ المألوفة كالتصنيف والفهرسة الموضوعية والتكشيف. والطرق الضمنية implicit‏ 
كالاستشهاد المر جعي . (المترجم) 
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ونظرا لأن تكشيف الاستشهادات المرجعية يتطلب القليل من الذكاء البشري» 
فإنه يمكن للعملية برمتها أن تتم آليا بسهولة. والواقع أنه يمكن لعملية تكشيف 
الاستشهادات المرجعية أن تتم كاملة دون أي تدخل بشريء الأمر الذي يبدو غير 
قابل للتحقيق بالنسبة للطرق الأخرى لتنظيم المعلومات. 
التسلسللات: 

ey‏ يمكن للاستشهادات المرجعية أن تقوم مقام البدائل بالنسبة للوثائق 
الأصلية» فإن التكشيف التسلسلي )1986 or “String indexing (Craven,‏ آخر 
لتنظيم المعلومات. ويمكن للتسلسلات أن تكون عبارات» أو مجموعات من 
العبارات» أو statement LA pai‏ ويتم إعدادها جميعا لتمثيل وثيقة ماعلل وجه 
التحديد ”فاستخدام العنكبوتية العالمية للتعلم اللامركزي في التعليم العالي Use of‏ 
“world wide web for distributed learning in higher education‏ « مثال 
oid‏ التسلسللات. 

وهناك أنواع مختلفة كثيرة من الكشافات التسلسليةء إلا أنها تتقاسم فيا بينها 
خاصتين رئيستين: (V)‏ صياغة سلسلة لتلخيص موضوع وثيقة ما يدوياء و(۲) توليد 
مداخل كشفية آليا اعتهادا على التسلسل المحدد لأغراض التنظيم. ولهذا فإن التكشيف 
التسلسلي حالة متميزة للتكشيف الآلي» الذي عولج بإيجاز في AVIY‏ 


(*) استعملت المؤلفة هنا كلمة strings‏ مرادفا لكلمة chains‏ التي ارتبطت تقليديا هذا الشكل 
من الكشافات .chain indexes‏ (المترجم) 
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و نظام كشاف السياق المصون PRE served context index system‏ 
(بريسيز (PRECIS‏ ونظام تكشيف العبارات المسورة Nested Phrase‏ 
Indexing System‏ (نفيز (NEPHIS‏ اثنان من أشهر النظم التي تطورت 
للتكشيف التسلسلي؛ ففي كلا النظامين» يتم أولا إعداد تسلسلات بواسطة مكشف 
بشري. وكشاف البريسيز مستخلص مصغر محمّل بمصطلحات التكشيف المناسبة» 
وكشاف نفيز عبارة موجزة لتكشيف وثيقة ما. ثم يتم بعد ذلك تشفير أو ترميز 
coded‏ هذه التسلسلات لبيان أي المصطلحات يمكن أن تكون نقاط وصولء وإقرار 
مكونات المداخل الكشفية. ويمكن لخوارزميات العرض الفعلية» التي تستخدم في 
كل نظام من نظم التكشيف التسلسلي» أن تختلف اختلافا بينا. إلا أن جميع المهام الآلية 
في التكشيف التسلسلي» يمكن معالجتها على نحو فعال بالوسائل الآلية. 

ويؤدي تكامل التحديد البشري لتسلسلات التكشيف. مع المعالجحة التي تتم بواسطة 
الحاسب لأشكال عرض الكشافات» إلى جعل التكشيف التسلسلي طريقة لتنظيم 
المعلومات ها جاذبيتها. فمثل هذا التكامل يحافظ على الجودة المرتبطة بالتكشيف البشريء إذ 
يتكفل البشر بإعداد تسلسلات التكشيف» من ناحية» ومن ناحية أخرى يمكن للتكشيف 
التسلسلي أن يحول دون الاستياء المرتبط بالطرق اليدوية المثبرة للضجر غير المطردة المفتقرة 
إلى الكفاءة. ge‏ يكن» OB‏ العصر الرقمي قادم بسرعة» ومن المتوقع للحاسبات أن تنهض 
بدور متزايد الأهميةء في تنظيم المعلومات واسترجاعها على السواء. 


مراجعة للطرق الرئيسة لتنظيم المعلومات: 


هناك كا تبين لنا في الأقسام السابقة» طرق متعددة لتنظيم المعلومات. ويلخص 
الجدول رقم ١/7‏ طرق التنظيم الرئيسة التي ناقشناها حتى الآن» من حيث نوع التنظيم» 
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والكيانات التي يتم تنظيمهاء وإطار التنظيم (ما إذا كان يعتمد على لغة مقيدة) فضلا عن 
طريقة الإنتاج. ولكل من هذه الطرق مظاهر قوتها ومواطن ضعفها. وعندما يقع الاختيار 
على طريقة بعينها لتنظيم المعلومات» كما يبين ميدو )1992( Lel Meadow‏ ينبغي أن 
تحقق ما يلي: 

)1( تميز بين مختلف الكيانات» (Y)‏ تتحقنق من الكيانات 


المتشاممة» )۳( تكفل الوصف الدقيق للكيانات» (5) SF‏ من 


الجدول رقم ١/7‏ طرق تنظيم المعلومات 











108 


وكا هو متوقع» فإنه لا يمكن لطريقة بعينها أن تلبي الشروط التي حددها 
ميدو كاملة. ويمكن لموطن الضعف في طريقة ما أن يكون مظهر قوة في غيرها؛ 
فالتكشيف وحده على سبيل المثال» لا يمكن أن يكشف عن جوانب معينة LAS gS‏ 
ew‏ يقصد بالاستخلاص JEE‏ وثيقة ما بكاملها. ولذاء فإن الجمع بين الطرق (أي 
استخدام أكثر من طريقة واحدة) هو الخياز» عندما يحتاج المرء للاختيار من بين الطرق 
pelea do ll‏ اللعلومات By‏ التطيق اللي العا Le yk‏ مو Gb‏ 
التنظيم (كالتصنيف مثلا مع الاستخلاصء أو التلخيص مع التكشيف). ويتزايد 
استخدام الطرق الناشئة كملخص الموقع الثري RSS‏ مثلاء والتمييز tagging‏ لتلبية 
الاحتياجات المتغيرة لتنظيم المعلومات في العصر الرقمي. 
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الفصل الثالث 
تنظيم المعلومات ¥: الموضوعات ذات الصلة 


ناقش الفصل الثاني الطرق الرئيسة لتنظيم المعلومات أو تمثيلهاء مع التركيز على 
التطبيقات التقليدية وتنويعاتها وامتداداتها. ونستكشف في هذا الفصل الموضوعات 
الأخرى المتصلة بتنظيم المعلومات؛ بها في ذلك ما وراء البيانات» والنصوص الكاملة 
وتنظيم الوسائط المتعددة. 


Le‏ وراء البيانات: 


ما وراء البيانات «Metadata‏ مصطلح تم سكه في نباية تسعينيات القرن 
العشرين» للدلالة على تلك التوصيفات التي تعد على وجه التحديد لتنظيم 
المعلومات الرقمية التي يمكن الوصول إليها على الونترنت. وقد تم تطبيق ما وراء 
البيانات في البداية على المصادر الإلكترونية؛ والمعلومات المرتبطة بالشبكات دون 
غيرها. وقد اتسع مفهوم المصطلح ليشمل جميع تطبيقات تنظيم المعلوماتء OY‏ ما 
وراء البيانات أصبح مصطلحا متداولا إلى حد بعيد» كما أن دور الإئترنت كمنصة 
للوصول إلى أنواع شتى من المعلومات في نمو مستمر. 


ماذا يقصد بما وراء البيانات؟ 


من الممكن الآن تعريف ما وراء البيانات بطريقتين؛ أولاهما أكثر تحديدا في 
مجالماء وتعنى التوصيفات التى تتوافر للمعلومات المرتبطة بالشبكات والمصادر 
الرقمية» باتباع مواصفة معيارية standard‏ أو إطار framework‏ (كبؤرة دبلن 
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Dublin Core‏ على سبيل المثال)» يتم إعداده فهذاالغرض على وجه التحديد. 
والتعريف الآخر أكثر اتساعا في alle‏ ويشمل بيانات الفهرسة والتكشيف» التي يتم 
إعدادها GY‏ نوع من الوثائق» باستخدام الطرق التقليديةء من أجل وصف المعلومات 
وتنظيمها. ومبذا المعنى» فإن بيانات الفهرسة التي يتم إعدادها بتصنيف ديوي 
العشري DDC)‏ وقواعد الفهرسة الأنجلو-أمريكية / الفهرسة المقروءة آليا 
(AACR/MARC)‏ على سبيل المثال» ينظر إليها أيضا بوصفها ما وراء البيانات. 

eg لقن‎ E ع ر تين‎ E EEEN 
.(Dempsey & Heery, 1998) المستودعات» ومن يقومون بالتجهيز كطرف ثالث‎ 
ويمكن لبعض معلومات ما وراء البيانات أن تكون أيضا كامنة في بيئة التنظيم الفائق»‎ 
أو الروابط الفائقة. وعلى‎ (HTML) في شكل تيجان لغة ترميز النصوص الفائقة‎ 
الرغم من أن ما وراء البيانات توفر أطرا لتنظيم المعلومات» وخصوصا بالنسبة‎ 
للمصادر المرتبطة بالشبكات» بالإضافة إلى الأطر القائمة (كخطط التصنيف وقواعد‎ 
هو في‎ lS] أن توفير ما وراء البيانات‎ Wool (1998) الفهرسة مثلا)» يرى وول‎ 
فإن‎ A /۲ /۲ الأساس» امتداد لعملية الفهرسة التقليدية. وا أوردنا بإيجاز في القسم‎ 
عملية الفهرسة التقليدية تبدو غير مجدية بالنسبة لتنظيم المصادر الرقمية على الإنترنت»‎ 
نظرا للخواص الفريدة التي نناقشها في الأقسام التالية.‎ 
خصائص المعلومات الرقمية على الإنترنت:‎ 

للمعلومات الرقمية» مقارنة بالمصادر الورقية» خصائصها التي تميزها. ويتعين 
على المرء الاعتاد على عتاد معين OLS yy‏ معينة» للاطلاع على حتوى المعلومات 
الرقمية. يضاف إلى ذلك أن المعلومات الرقمية ينبغي أن تكون مسجلة بنوع من 
الصيغ format‏ التي تتغير دائم| [IS‏ ارتفع مستوى العتاد والبرمجيات أو تطور. 
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وأحيانا ما تكون الطبعات المختلفة من البرمجيات نفسها متوافقة» إلا أا لا تكون 
كذلك في الغالب الأعم. وتصبح قضية التوافق أسوأ Ve‏ إذا كان المرء يتعامل مع 
معلومات رقمية ناشئة بحزم بر OLS‏ مختلفة. 


وفضلا عن US‏ فإن المعلومات الرقمية على الإنترنت» عادة ما تسجل في 
شكل تنظيم فائق» يتناقض بحدة مع التنظيم المسطح للمعلومات الورقية. pong‏ 
ظهور الإنترنت» على الإنسان التواصل وتقاسم المصادر إلا أن OLE‏ تقنيات ضبط 
الجودة على الإنترنت يسفر عن فيضان من المعلومات التي 5 تتمتع بدرجات متفاوتة من 
الجودة. ولهذا فإنه ينبغي اتباع طرق مختلفة لوصف وتنظيم المعلومات الرقمية على 
الإنترنت ت؛ نظرا OY‏ المواصفات المعيارية (كتصنيف ديوي العشرى DDC‏ وقواعد 
الفهرسة الأنجلو-أمريكية/ مارك / (AACR/ MARC‏ قد وضعت قبل إنتاج 
المعلومات الرقمية بكميات ضخمة» مصممة في المقام الأول لتنظيم المعلومات 
الورقية. وقد ظهرت ما وراء البيانات لمجرد التعامل مع مشكلة تنظيم المعلومات 
الرقمية» التي تصاغ formatted‏ بطريقة فريدة» وتتسم بالتغير المستمر» وتفاوت 
الجودة» وضخامة الكم. 
أمثلة للمواصفات المعيارية لما وراء البيانات: 


على الرغم من أن مفهوم ما وراء البيانات جديد نسبيا في مجال تنظيم 
المعلومات» فقد تم وضع عدد كبير من المواصفات المعيارية لما وراء البيانات» كما أن 
هناك الكثير في الطريق. وبؤرة دبلن Dublin Core (DC)‏ وإطار وصف المصادر 
Resource Description Framework (RDF)‏ بعض أمثلة المواصفات 
المعيازية لا ely‏ البياناتت: 
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بؤرة دبلن: l‏ 

وبؤرة دبلن DC‏ أنموذج بسيط لوصف المحتوى بالنسبة للمصادر الإلكترونية 
(Weibel, 1997)‏ وبؤرة دبلن جهد مشترك بين خبراء في مجال المكتبات» 
ومجموعات البحث في المشابكة والمكتبات الرقمية» ومجموعات متعددة من 
اختصاصيي المحتوى» في سلسلة من ورش العمل المتفرقة» القائمة على دعوة 
المشاركين فيها» تسمى سلسلة ورش عمل بؤرة دبلن Dublin Core Workshop‏ 
Series‏ وتتكون بؤرة دبلن من خمسة عشر عنصراء هي العنوان» والمنشئ 
والموضوع» aie gly‏ والناشرء والمساهم» والتاريخ» والنوع» والصيغة. 
ومحدد الهوية» orally‏ واللغةء والعلاقة» والتغطية» والحقوق. وكا بين وايبل 
Weibel (1997)‏ : 


فإن بؤرة دبلن لم يقصد بها أن تحل محل نهاذج الوصف 
الأكثر ثراء» كالفهرسة بقواعد الفهرسة الأنجلو-أمريكية / 
مارك lily‏ لتوفر مجموعة بؤرية من عناصر الوصف» التي يمكن 
البسيط للمصادر. (p.9)‏ 
وتستخدم بؤرة دبلن عملياء.في المقام الأول» لتوفير توصيفات بسيطة للمصادر 
الشبكية» كمواقع العنكبوية على سبيل المثال. ويبدو أا أشهر مواصفة معيارية من بين 
جميع نماذج ما وراء البيانات. وفضلا عن ذلك» فإن بؤرة دبلن هي الأنموذج PIM‏ 
prototype‏ الذي أعطى دفعة لتطوير إطار وصف المصادر RDF‏ في تجمع 
العتكبو تية العالمية World Wide Web Consortium (W3C)‏ . ویر تبط القاكمون 
وصف المصادر. 
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تطور إطار وصف المصادر برعاية تجمع العنكبوتية العالمية؛ إذ أصبح إحدى 
توصيات هذا التجمع» في فبراير عام ۱۹44ء ثم أصبح بعد ذلك مكونا رئيسا في 
العنكبوتية الدلالية» التي وضع تصورها بيرنرز-لي Berners-Lee‏ والعاملون ans‏ 
(Berners-Lee, Hendler, & Lassila, 2001; Shadbolt, Hall, &‏ 
Berners-Lee, 2006)‏ على سبيل JLL‏ ويشتمل القسم ۲١‏ عل مناقشة 
عبوف اا شى yy lite‏ تلع الو ات راوج اا رك ذهو BLS‏ 
‘Shafer (1998)‏ 
فإن إطار وصف المصادر بنية أساس لتشفير encoding‏ أو 
ترميز ما وراء البيانات ونمذجتها وتبادها. وإطار وصف المصادر 
في جوهره» أنموذج ثلاثي الأبعاد بسيط: فا وراء البيانات تتعلق 
بمصدر le‏ وللمصدر خاصية واحدة أو أكثر» ولكل خاصية 
قيمة. (21 .م) 
ويستخدم إطار وصف المصادر لغة الترميز القابلة للتوسع eXtensible‏ 
lao » Markup Language (XML)‏ نظم syntax‏ النقل. ويتم تطوير إطار 
وصف المصادر لدعم الكثير من احتياجات ما وراء البيانات المختلفة؛ للمتعهدين 
وموردي المعلومات )1997 (Weibel,‏ ولا يتكفل إطار وصف المصادر بالدلاللات» 
وإنما يكفل قدرة كل وسط أو تجمع لوصف المصادره على تحديد معالم نظام دلالي يعبر 
عن متطلبات ذلك الوسط أو التجمع. وبعبارة أخرى» ob‏ إطار وصف المصادر» على 
عكس بؤرة دبلن» لا يحدد دقائق مواصفات العناصر المعينة التي ينبغي أن يتضمنها 
الإطارء [aly‏ يكفل لمن يستخدمونه حرية اختيار معام المواصفات وتحديدها في حدود 
إطارهم» بناء على احتياجاتهم. ومن ثم فإن إطار وصف المصادر يشكل أساسا لتجهيز 
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ما وراء البيانات. وك| ذهب لاسيلا )1997( Lassila‏ فإن إطار وصف المصادر 
يمكن أن يستخدم في OVE‏ تطبيقية عدة؛ في اكتشاف المصادرء على سبيل المشال» 
لدعم قدرات محرك البحث» Bs‏ الفهرسة لوصف المحتوى وعلاقات المحتوى المتاحة 
على موقع عنكبوتية بعينه» أو صفحة عنكبوتية بذاتهاء أو مكتبة رقمية بعينها. ويشتمل 
القسم ١/۳/٠١‏ على المزيد من المعالجة لإطار وصف المصادره في سياق النظر في 
الحقدسة المغيازية للفتكبوتية الدلالية: 
محدد هوية الكيانات الرقمية: 
على عكس كل من بؤرة دبلن» وإطار وصف المصادر. فإن محدد هوية الكيانات 
الرقمية Digital Object Identifier (DOT)‏ يوضح معالم الكيانات الرقمية كلا 
على حدة (كمقالات الدوريات» ومقاطع الفيديوء والمقطوعات الموسيقية على سبيل 
(JULI‏ بخطته المحددة الخاصة. والمؤسسة الدولية لمحدد هوية الكيانات الرقمية 
International DOI Foundation (2009)‏ منظمة تأسست لتطوير وإدارة نظام 
حدد هوية الكيانات الرقمية» وتبين في صفحتها الرئيسة :(www.doiorg)‏ 
لقد قصد بنظام محدد هوية الكيانات الرقمية Digital‏ 
Object Identifier (DOI) System‏ تحديد هوية كيانات 
المحتوى في البيئة الإلكترونية. ويتم تخصيص أو تعيين أسماء محدد 
هوية الكيانات الرقمية لأي OLS‏ للاستعمال على الشبكات 
الرقمية. وتستخدم هذه الأسماء لتوفير معلومات حديثة» تشمل 
أماكن العثور عليها (أو على معلومات حوها) على الإنترنت. ومن 
الممكن للمعلومات المتعلقة بكيان رقمي ما أن تتغير من وقت 
لآخر» بها في ذلك مكان العثور عليه إلا أن اسم محدد هوية الكيان 
TEA‏ 
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ويتكون نظام محدد هوية الكيانات الرقمية من ثلاثة أجزاء؛ هي محددات 
المويةء والدليل» ومرصد بيانات نظام محدد هوية الكيانات الرقمية. ويضم كل محدد 
للهوية صدراً أو سابقة prefix‏ وعجزا أو لاحقة أو كاسعة suffix‏ يفصل gre‏ 
شرطة تميل لليسار forward Slash‏ (/ ). ويتم ce‏ أو تحديد الصدرء الذي يعرف 
أيضا بمحدد هوية الناشر publisher ID‏ من قبل وكالة تسجيل محددات هوية 
الكيانات الرقمية للناشرين» أما العجز الذي يسمى أيضا محدد هوية المادة „citem ID‏ 
فيعين أو يحدد من قبل الناشر (2007 (Wang,‏ وبنية محدد هوية الكيانات الرقمية 
وتعيينه يشبهان. في الجوهر بنية وتعيين الرقم المعياري الدولي للكتاب 
«(international Standard Book Number ISBN)‏ والر قم المعياري الدولي 
للدورية «(International Standard Serial Number ISSN)‏ هذان النظامان 
اللذان يستخدمان منذ سبعينيات القرن العشرين» للتحقق من هوية الكتب 
والدوريات» على نحو لا لبس فيه. يضاف إلى ذلك أن نظام محدد هوية الكيانات 
الرقمية يستخدم دليلا مركزيا لتدارك المشكلات المتعلقة بتغيرات ملكية المحتوى 
الرقمي وأماكنه. ويتم اختزان المعلومات المتعلقة بالكيان الذي تحدد هويته في مرصد 
بيانات نظام محدد هوية الكيانات الرقمية )2004 (Nair & Jeavan,‏ 

وهناك خاصتان تميزان محددات هوية الكيانات الرقمية عن جميع طرق تنظيم 
المصادر الرقمية؛ أولاهما أن حدد هوية الكيان الرقمي يمكن تطبيقه للكيان الرقمي 
بكامله (كالدورية التخصصية على سبيل المثال) أو أي جزء منه (كالقسم» أو الشكل 
التوضيحي» أو الجدول على سبيل المثال) على السواء. وتكفل خاصية تطبيق محدد 
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هوية الكيان الرقمي هذه» بالمعنى الحرفي» تنظيم المعلومات على أي مستوى من 
التحليلء الأمر الذي نادراً ما يتحقق في المجالء إلا أن له مضامينه الإيجابية بالنسبة 
لاسترجاع الفقرات. أما الخاصية الثانية فإن محدد هوية الكيان الرقمي يتسم بالثبات 
والاستقرار والاطراد؛ بمجرد أن يسجل ويعين» في ربط محتواه بالدليل الذي (Slo‏ ما 
يشتمل على المكان الراهن لذلك الكيان الرقمي» بصرف النظر عما إذا كان سلفه يمكن 


أن يتغير أو يختفي من الإنترنت. 5 


ولا يكفل نظام حدد هوية الكيان الرقمي نهجا بديلا لتنظيم المعلومات فحسب» 
وإنما يتيح إمكانية الوصول السلس إلى الكيانات الرقمية التي يتم التحقق من هويتها. 
ومن أمثلة تطبيق محددات هوية الكيانات الرقمية» منظمة كروسرف 
(www.crossref.org) Crossref‏ وهصي منظمة غير ربحية» تضم دو poll‏ 
والمكتبات» Gag‏ إلى ربط المستفيدين» عن طريق محددات هوية الكيانات الرقمية» 
بالمحتوى البحشي الأولي كالكتب» ومقالات الدوريات» وأعمال المؤتمرات. ويقوم 
الناشرون المرتبطون بكروسرف بتعيين محددات هوية الكيانات الرقمية لكل مادة 
ينشرونهاء ويمكن للمستفيدين بدورهم الوصول إلى تلك cal gl‏ عن طريق روابط تحديد 
هوية الكيانات الرقمية. 

إلا أن نظام محدد هوية الكيانات الرقمية يبدو أقرب إلى تقنية الربط الدائم 
الموحدة منه إلى المواصفة المعيارية لما وراء البيانات» وذلك لأن كل محدد لهوية 
الكيانات الرقمية يرتبط بسلسلة تماوراء البيانات» بالإضافة إلى مجموعة من 
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المعلومات الوراقية والتجارية المتصلة بمحتواه (كالعنوان» والمؤلف» وتاريخ النشرء 
والسعر» على سبيل المثال). وعندما يتم تحويل معلومات محدد هوية الكيانات الرقمية 
إلى الناشرء فإنه om‏ عن حدد هوية الكيانات الرقمية في بياناته الوراقية» ويعثر على 
المحتوى عن طريق معلومات الربط المختزنة في الدليل المركزي. ومن ثم يمكن 
للمحتوى الرقمي أن يظهر للمستفيد على شاشة الحاسب. 

وقد تم تطوير مواصفات معيارية أخرى لما وراء البيانات» أو في سبيلها 
للتطوير لوصف المعلومات الرقمية على الإنترنت. وقد أجرى زنج وكين Zeng and‏ 
Qin (2008)‏ دراسة وصفية تحليلية شاملة للمواصفات المعيارية الحالية لما وراء 
البيانات» وقس) هذه المواصفات إلى ثاني فئات (المواصفات ذات الأهداف العامة» 
والمصادر الثقافية والبصرية» والأرشيفات والمحفوظات).. وهناك تزايد في الحاجة إلى 
المواصفات المعيارية لما وراء البيانات code‏ وكذلك الحال أيضا بالنسبة للمخاوف 
والتساؤلاات. 
بعض التساؤلات والمخاوف حول ما وراء البيانات: 

يتم إنشاء ما el yy‏ البيانات» كا سبق أن بيناء من أجل وصف المصادر الرقمية 
وتنظيمها في الأساس. إلا أنه فيا يتعلق بطبيعة المعلومات الرقمية أو مصادر 
الإنترنت» ما جدوى ما وراء البيانات؟ ففي البيئة الورقية تتم فهرسة كل مطبوع 
تضمه مجموعات المكتبة. وفيا يبدو OB‏ الأسلوب نفسه غير قابل للتطبيق بالنسبة 
للمعلومات الرقمية على الإنترنت؛ نظرا للأسباب التي سبق ذكرها. ويطفو على 
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السطح أيضا تساؤل ممائل: من يمكن أن ينشئ ما وراء البيانات» في ظل الكميات 
الضخمة» والجودة غير المؤكدة للمصادر المرتبطة بالشبكات؟ 


ويتوقف توقع دورة حياة المعلومات الرقمية» إلى حد بعيد» على توافر التقنيات 
(كالعتاد والبرمجيات على سبيل المثال) التي تستخدم لأغراض إنشاء المعلومات 
والوصول إليها. ولا كانت تقنيات المعلومات تتطور بسرعة» فكيف يمكن أن نضمن 
للمصادر Lead JI‏ نمجرد وصفهاء أن يتم العشور عليها واسترجاعها في جميع 
مراحل حياتها؟ 


وني البيئة الورقية» يظل محتوى أي مطبوع ىا هو إلى أن تصدر منه طبعة 
جديدة. أما في البيئة الرقمية» فإن محتوى أي وثيقة يمكن أن يتغير باستمرار. إذن» 
كيف نتعامل مع المحتويات الديناميكية لكثير من هذه المصادر» عندما نحاول توفير ما 


وراء بيانات cu‏ 


وكا سبق أن ناقشناء فإن هناك مواصفات معيارية لما وراء البيانات» لتنظيم 
المعلومات الرقمية على الإنترنت. ولدينا في الوقت نفسه مواصفات معيارية كتصنيف 
ديوي العشريء وقواعد الفهرسة الأنجلو-أمريكية/ مارك» التي كنا نستخدمها على 
مدى سنوات» لوصف المصادر الورقية. والآن» كيف يمكن استيعاب ما وراء 
البيانات في الأطر القائمة الأخرى؟ وقد أشار دمبسي وهيري Dempsey and‏ 
Heary (1998)‏ إلى أن مجتمع المكتبات قد بدأ توا ينظر في سبل وضع ما وراء بيانات 
dle”‏ الكتاب" » وما وراء بيانات “الشبكات” في سياق الاستخدام نفسه. ومن بين 
مغل هذه المحاولات جهود أوسي إل سي OCLC‏ في الارتقاء بتصنيف ديوي 
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العشري» بأدوات مثل صائغ الكلمات wordsmith‏ الذي يقتطف المفاهيم 
والمصطلحات الحديدة والناشئة» من نصوص غير مقيدة» ويربطها بتصنيف ديوي 
العشري )1997 .(Vizine-Goetz,‏ 


وبالإضافة إلى ما تمت معالحته هنا بإيجاز. تظل قضية القابلية للتشغيل التبادلي 
interoperability‏ في صميم حركة ماوراء البيانات (Rowley & Hartley,‏ 
)2008. وتدل القابلية للتشغيل التبادلي على قدرة نظم أو مكونات متعددة» بمنصات 
وواجهات تعامل» وبنى بيانات مختلفة» على تبادل البيانات وتقاسمهاء بأقل قدر من 
الفاقد في المحتوى والوظيفية )321 (Zeng & Qin, 2008, p.‏ وقد تناول زنج 
وتشان )2004( Zeng and Chan‏ على وجه التحديد, قضايا في دعم القابلية 
للتشغيل التبادل» بين نظم معالجحة المعرفة» التي غالبا ما تستخدم لإنشاء ما وراء 
البيانات. ويبدو أنه ليس من السهل تحقيق القابلية للتشغيل التبادلي» على الرغتم من 
بذل جهود ضخمة في ذلك الاتجاه. يضاف إلى ذلك أن لكل مواصفة من مواصفات 
ما وراء البيانات قضاياها ومخاوفها المرتبطة مها دون سواها؛ ولنأخذ محدد هوية 
الكيانات الرقمية DOT‏ كمثال )2007 (Wang,‏ أي من المواصفات المعيارية لما وراء 
البيانات يمكن أن تستخدم عند تعيين محددات هوية الكيانات الرقمية؟ هل يمكن 
تعيين محددات مختلفة هوية الكيانات الرقمية» لكل شكل ولكل طبعة؟ 

ولا تشمل التساؤلات والمخاوف التي أحصيناها هنا بحال» جميع التحديات 
التي نواجهها في تنظيم المعلومات الرقمية على الإنترنت» بنهج ما وراء البيانات. 
وفضلا عن ذلك» فإنه ليست هناك خطة عامة للتعامل على وجه التحديد» مع هذه 
التساؤلات والمخاوف. والوصف الانتقائي» والتجديد المجدول زمنياًء والحفظ 
الأرشيفي المخططء من بين المارسات الراهنة المتبعة في توفير ما وراء البيانات 
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للمصادر الرقمية. وما وراء البيانات» مهما OLS‏ من الممكن للممارسات الراهنة 
والمستقبلية أن تتغير» إن| قصد بها في النهاية تيسير تنظيم ا معلومات الرقمية» بحيث 
يمكن أن تسترجع في| بعد على نحو أكثر فاعلية. 


النصوص الكاملة: 


عندما كان حيز اختزان الحاسبات ثميناء ووقت استخدامها باهظ التكلفة» م 


كوو Le gla spe Kall‏ يناك Bape gh) LAS yo ul‏ 
والتكشيف على سبيل المثال) أن تختزن رقميا لأغراض الاسترجاع. أمااليوم» فإنه 
يمكن لحاسب شخصي عادي أن يكون قوياء من حيث حيز الاختزان وطاقة المعالجة 
الإلكترونية. ولم يعد اختزان النصوص الكاملة واسترجاعهاء في العصر الرقمي» من 

المارسات النادرة. 


تنظيم معلومات النصوص الكاملة: 


تنظيم معلومات النصوص الكاملة التي تختزن رقمياء من نتائج تطور تقنيات 
المعلومات ولاشك )1992 (Meadow,‏ إلا أن تنظيم النصوص الكاملة لاهو 
”اعتبار كل كلمة بمثابة واصفة“ (1993 (Fugmann,‏ ولا هو ”لاضرورة: 
“Ut‏ فالأمر يتطلب bs‏ | خفيا invisible‏ أو ضمنيا أو مطمورا 
embedded‏ خلاف النصوص الكاملة نفسهاء لكي تكون المعلومات قابلة 
للاسترجاع. ويتقاسم تنظيم النصوص الكاملة معظم خواص التكشيف (SES‏ 
بإتباع قائمة الكلمات المستبعدة stop word list‏ بالإضافة إلى رد الكلمات إلى 
جذورها stemming‏ والأساليب الماثلة. وما هذا النهج سوى ما oll‏ لون Luhn‏ 


124 


تكشيف الكلمات المفتاحية» الذي يمكن أن يتم آليا في العادة. وتستخدم نظم 
استرنجاع الإنترنت الشهيرة» مثل جوجل (Google‏ طريقة تكشيف الكلات المفتاحية 
صعوبات تنظيم النصوص الكاملة: 


بينم| يبدو تنظيم النصوص الكاملة مرغوبا فيه من جانب المستفيدين» فإن 
الناتج غالبا ما يكون مختلطا ؤمغرقاًء نظراً UKEL‏ التحقيق المنخفض. ويمكن للمثال 
الملائم أن يكون النتائج التي تسترجعها معظم نظم استرجاع الإنترنت؛ فغالبا ما 
يسترجع البحث بالكلمات المفتاحية في العنكبوتية العا ميةء عدة آلاف من المواقع على 
الأقل» لا يمكن إلا لعدد قليل منها فقط أن يكون صالحا للاستفسار الذي قدم 
للنظام. ويسجل فاحمان )1993( :Fugmann‏ 


يفرض اختزان النصوص الكاملة أعباء ضخمة؛ على وجه 

الخصوص على حيز الاختزان» وعلى وقت البحث أو التنقيب. 

ولا ينطوي العنصر الثاني على استنفاد وقت ADL‏ بواسطة 

الآلات فحسب» وإنها يشمل أيضاء وهذا هو الأهم» وقت 

الإنسان وجلده» اللازمين لتنقية الكم الزائد من الشوشرة 

(p. 99) المسترجعة.‎ 

ولم يعد اختزان النصوص الكاملة» كا سبق أن بيناء قضية في تنظيم المعلومات 
واسترجاعهاء وذلك بفضل تطور تقنيات استخدام الحاسبات. إلا أن جودة التنظيم 
بالنسبة لمعلومات النصوص الكاملة؛ أبعد من أن تكون مرضية» الأمر الذي يتضح 
[Glo‏ في النتائج التي تقدمها معظم نظم استرجاع الإنترنت. وتتوقف الاختراقات 
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المستقبلية في حل هذه المشكلة الجوهرية» في المقام الأول» على البحث في معالجة اللغة 
الطبيعية (NLP)‏ وتشمل بعض المهام الجوهرية» التي ينبغي أن يتصدى ها الباحثون 
في معالحة اللغة الطبيعية: )١(‏ إقرار البنيان النظمي syntactic structure‏ للجملة 
(مثل: يطير الوقت كالسهم (Time flies like an arrow‏ ويعرف أيضا بالإعراب» 
و(۲) إقرار معنى كلمة (كالواجب duty‏ مثلا) في السياق» أي المعاني المتعددة لكلمة 
ما )1999 (Knight,‏ ويحظى موضوع Les‏ جة اللغة الطبيعية بمزيد من المناقشة في 
الفصل الثاني عشر ”الذكاء الاصطناعي في تنظيم المعلومات واسترجاعها . 
gad Riese‏ الي ار ل إل Sl‏ غير ال SNC‏ 
والجداول» من أجل الاسترجاع في نظم معلومات النصوص الكاملة (Fugmann,‏ 
)1993 إذا كان التنظيم يتم آليا. ولكن» ماذا عن الأنواع الأخرى من معلومات 
الوسائط المتعددة» كالأصواتء والصور المتحركة. التي تتاح في صيغ رقمية؟ كيف 
يتم تنظيم معلومات الوسائط المتعددة في نظام الاسترجاع؟ ونتناول هذا الملوضوع 


في القسم التالي. 


تنظيم معلومات الوسائط المنعددة: 

هناك تزايد في معلومات الوسائط المتعددة التي يتم إنتاجها في العصر الرقمي» 
كا يجعل ظهور العنكبوتية العالمية الوصول إلى مثل هذه المعلومات أكثر سهولة مما كان 
عليه من قبل. إلا أن تدفق معلومات الوسائط المتعددة بغزارة» يمثل أيضا تحديات غير 


مسبوقة بالنسبة لمجال تنظيم المعلومات واسترجاعها. 
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أنواع معلومات الوسائط المتعددة: 

الوسائط المتعددة هي أي جمع بين الصوت والصورة والمعلومات النصيةء 
تشتمل فيه الصور على كل من الصور الثابتة والصور المتحركة. ومن الممكن معاملة 
كلمتي صوتي sound‏ وسمعي [gine y audio‏ مترادفين» إلا أن هناك ميلا لإحلال 
. مصطلح ”سمعي“ محل ”صوتي“. وأحيانا ما تستعمل عبارة الوثائق الناطقة 
IYL spoken documents‏ عل المعلومات النصية المسجلة شفويا (كالأحاديث 
speeches and talks‏ على سبيل المثال). وا هو الحال بالنسبة لمعلومات الصورء 
تشمل الصور الثابتة كلا من اللوحات» والصور الضوئية» والملصقات وما شابهها. 
ويمكن للصور المتحركة أن تكون مصحوبة أو غير مصحوبة بالصوت. وعادة ما 
تكون الصور غير المصحوبة بالصوت رسوماً متحركة animations‏ أو أفلاماً 
سينائية صامتة. وتصبح الصور المتحركة المصحوبة بالصوت مقاطع فيديو أو أفلاماً 
سينائية. ويمكن للنصوص أن تظهر في المعلومات الصوتية كتبصرات 
annotations‏ وني الصور كعناوين أو ترجمات. ويوضح الشكل رقم ١/۳‏ الأنواع 
المختلفة لمعلومات الوسائط المتعددة. 


طريقتان رئيستان للتنظيم: 
لقد كانت الوسائط المتعددة» (gee led‏ عادة ما تنظم بواصفات تعتمد» على 


سبيل المثال» على اسم المنشئ» وحجم الصورة وعبارات أو حتارين lS gree‏ 


مفتاحية. ومن ثم فإن هذه الطريقة تسمى الاعتاد على الوصنف أو التوصيف 
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description based‏ وظلت على مدى زمني طو يل تستخدم من جانب 
اختصاصيي المكتبات وغيرهم من اختصاصيي المعلومات» لتنظيم الوسائط المتعددة. 
وعلى الرغم من أن التنظيم القائم على التوصيف للوسائط المتعددة» يتعين دائ| أن يتم 
بواسطة البشرء فإن جودة النتائج النهائية كانت تتفاوت؛ نظرا لأن الوسائط من بين 
أسباب أخرى» كان من الصعب في بعض الأحيان» وصفها بطريقة صريحة 
وموضوعية. فكيف يمكن على سبيل المثال للمرء ء أن يصف صراحة» صورة تشبه 
غروب الشمس» أو مقطوعة موسيقية» تبدو هادئة ومسالمة؟ يضاف إلى ذلك كيف* 
يحقق البشر تنظي| مطردا دقيقا لمعلومات الوسائط المتعددة» عن طريق اتباع هذا النهج 


fsubjective jli 


وقد تطور النهج المسمى بالقائم على المحتوى content based‏ أي تنظيم 
الوسائط المتعددة بخواصها المميزة» كلون الصورة» وطبقة الصوت»..لتجنب أوجه 
القصور التي تكتنف اللنهج القائم على التوصيف. وبناء على التقنيات الرئيسة 
(كالتعرف على الحديث speech recognition‏ والتعرف على الأنماط pattern‏ 
recognition‏ وفهم الصور) التي تستخدم في تحليل الوسائط المتعددة لأغراض 
التنظيم» عادة ما يتبع النهج القائم على المحتوى» من جانب الباحثين في علوم 
الحاسب. كذلك يمثل هذا النهج تغيرا في الإطار النظري الأساس في تنظيم الوسائط 
المتعددة. وإذا ما تم تطبيق تنظيم الوسائط المتعددة القائم على التوصيف» وذلك 
بوصف ”المضاف إليه “ofiness‏ (كاسم المنشئ وتاريخ النشر) و ”حيثيات أو 
ملابسأت “aboutness‏ الشيء أو حتواه (كالكلمة المفتاحية والموضوع مثلا) OLS‏ 
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التنظيم القائم على المحتوى يتحقق بتحليل خواص الوسائط المتعددة وصفاتهاء كلون 
الصورة وطبقة.الصوت على سبيل ال مثال. 
الوسائط المتعددة 


لعجل هو 


الصور النصوص الأصوات 


Po 


العناوين الفرعية الوثائق الناطقة 1 


الصور المتحركة pa‏ الثابتة 


“لت 7 


الفيديو / الأفلام ‏ الأفلام الصامتة 





الشكل رقم */ ١‏ فئات معلومات الوسائط المتعددة 

وخواص الوسائط المتعددة متعددة الأوجه أو الجوانب. وتشمل الخواص 
المشتركة للصور الثابتة اللون» والشكل» والقوام أو النسيج texture‏ وغير ذلك Le‏ 
يمكن تحليله أيضا بالاتجاهية «directionality‏ والعشوائية «randomness‏ 
والخشونة 5 » والتباين contrast‏ وما شابه ذلك. وبالنسبة للمعلوفات 
الصوتية» فإن الخواص كالطبقة والسرعة أو الإيقاع؛ غالبا ما توضع في الحسبان 
لأغراض التنظيم. ومن الممكن عادة هذه الخصائص البدائية أو منخفضة المستوى أن 
تستخلص آلياء أو بطريقة نصف آلية» الأمر الذي يلغي الحاجة إلى المشاركة البشرية 


129 


باهظة التكلفة» وإن لم تكن مجزية دائماء في عملية التنظيم. ومن الممكن النزول 
بمستوى الخصائص بالنسبة لمعلومات الفيديو إلى تلك الخاصة بالصورة الثابتة 
والصوت» بعد عملية التقطيع أو التجزئ التي نتناو ها في 7/ IT‏ 


ومن بين هذين النهجين المتميزين لتنظيم الوسائط المتعددة» (cal‏ يستخدم في 
الغالب الأعم في البحوث والتطبيق؟ فقد أجرت تشو )2001( Chu‏ تحليلا 
للاستشهادات المرجعية للإنتاج الفكري المنشور في SLE‏ تكشيف الصور 
واسترجاعهاء وتبين لها أن النهج القائم على المحتوى كان هو الغالب في المجتال». 
وخصوصا في السنوات الأخيرة. ويفسر التعقد المرتبط باتباع النهج القائم على 
التوصيف» وتطور التقنيات الرئيسة التي تستخدم في النهج القائم على المحتوى» 
جزئياء نشأة ونمو الطريقة القائمة على المحتوى لتنظيم الوسائط المتعددة. إلا أن نتائج 
تشو لا تعني أن النهج القائم على المحتوى يمكن أن يكون الطريقة الوحيدة الي يقع 
عليها الاختيار لتنظيم الوسائط المتعددة. وعلى العكس» فإن النهج القائم 
على التوصيف» إذا ما اتبع على نحو سليم ومطرده» yal‏ على تحقيق تنظيم جيد» 
قد يكون من الصعب ab gh‏ بالنهج القائم على المحتوى. ويبدو أن التكامل بين 
النهجين المختلفين» بالجمع بين مزايا كليهماء طريق مشالي يمكن اتباعه في تنظيم 
الوسائط المتعددة. 


التحديات فى تنظيم الوسائط المتعددة: 
بالإضافة إلى ما سبق أن ذكرنا من مشكلات مرتبطة بنهجي التنظيم» يبدو تجزىء 
segmentation‏ الصور المتحركة أو تقطيعهاء وتحليل الحديث speech parsing‏ حجر 


عثرة في تنظيم الوسائط المتعددة؛ فتجزىء الصور المتحركة» خطوة لاغنى عنها لتحليل 
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الصور المتحركة إلى وحدات فرعية على سبيل المقال (كعمليات الكاميرا والسكتات 
الللحوظة salient stills‏ مثلا) والأطر الرئيسة (أي الأطر التي تمثل كل لقطة) التي يمكن 
حينئذ أن تكون بمثابة الأساس لتحليل المحتوى وتنظيمه )1995 (Zhang, et al.,‏ 
a‏ تعر يلات italy‏ كات درن اديور 
المتحركة. إلا أن جوهر العملية يظل كا هو: تقسيم الصور المتحركة إلى كيانات أصغر 
ها دلالتهاء بحيث يمكن تنظيمها على نحو مناسب وبدقة. 

ويدل تحليل الحديث على عملية تجزىء الأحاديث الكاملة إلى فقرات وجمل 
وعبارات وكلهات» حتى يمكن التحقق من محتواها الموضوعي وتنظيمها. ومن 
الصعب صياغة المعايير الخاصة بتحليل أي من الصور المتحركة أو تجزىء الحديث؛ 
نظرا لطبيعة الصور المتحركة والمعلومات الصوتية؛ فالصور المتحركة متواصلة في 
الزمان والمكان. إلا أن الفواصل بين لقطات الكاميرا المتعاقبة لا يمكن الاعتماد عليها 
دافا لأفراض الععزىء. :وغل cast anil youl‏ فان مارات اندي speek BY‏ 
. علامات ترقيم أو فراغات بين الكلمات»ء أو أي نوع آخر من العلامات» كا يمكن أن 
يكون عليه الحال في المعلومات التحريرية» وذلك للاسترشاد بها في التتجزىء. يضاف 
oa Los oF lb ol‏ ا E pleas‏ للدت dad‏ بزو lage ors ioe‏ 
صعبة. ومن بين أمثلة قيود الحديث )1996 (Spärck Jones, et al.,‏ الأحداث أو 
الو ails‏ غير المنطوقة nonspeech events‏ (كالتنفس الجهري loud breath‏ 
وطقطقة اللسان (tongue clicks‏ ومظاهر انعدام الطلاقة disfluencies‏ 
(كالكلمات التي لا تنطق كاملةء والوقفات» والتردد (hesitations‏ والأحداث 
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والمكونات الوظيفية (مثل حرف العطف and‏ وعبارة بالإضافة إلى (in addition‏ 
ونظرا هذه المشكلات, فإن الأمر يتطلب المزيد من البحوث قبل أن تكون لدينا طرق 
آلية جيدة لتجزىء المحديث والصور المتحركة. ولا تزال مشاركة الإنسان تبدو 
ضرورية في تنظيم الوسائط المتعددة» حتى باتباع النهج القائم على المحتوى. 

ويمكن القول بوجه عام» أن ما أجري من بحوث حول تنظيم الوسائط 
المتعددة أقل مما أجري جول تنظيم المعلومات النصية. ومن بين جميع أنواع الوسائط 
المتعددة المختلفة» تبدو المعلومات الصوتية أقل حظا في الدراسة من حيث التنظيم. 
وفي الوقت نفسه» يشهد العصر الرقمي كميات متزايدة من معلومات الوسائط 
المتعددة. ومن ثم» فإن سبل تنظيم معلومات الوسائط المتعددة تفرض تحديات 
ضخمة» إذا ما أردنا أن نجعل معلومات الوسائط المتعددة من الممكن الوصول إليها 


عند الحاجة. 


مزيد من الاستطراد حول تنظيم المعلومات: 

تنظيم ا معلومات أمر جوهري لا غنى عنه» في استرجاع المعلومات لسببين: 
أوهما أن المعلومات ينبغي أن تنظم لكي يكون من الممكن استرجاعهاء وثانيهما أن 
جودة التنظيم تؤثر في أداء الاسترجاع على نحو مباشر. يستند جهدنا في تنظيم 
المعلومات» بوجه عام» إلى سمات 088655 المعلومات» وحيثياتها أو محتواها 
caboutness‏ في]| عدا النهج القائم على المحتوى بالنسبة لتنظيم الوسائط المتعددة. 
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وتشمل السمات خواص كا مؤلف واللغة وتاريخ النشرء بين| تتعلق الحيثيات بالمحتوى 
الموضوعي للمعلومات. وللمقارنة فإن تنظيم المعلومات القائم على السات الشكلية 
أو الخارجية أو الملامح» مباشر واضح ALL‏ وأقل إثارة للتحديات» ley‏ طرق تنظيم 
الحيثيات أو المحتوى أكثر صعوبة في تطبيقها. 

ويعاني أداء ep le GeV‏ مالم يتم تنظيم المعلومات على نحو سليم مناسب. ولا . 
يمكن المبالغة في تأكيد أهمية أن يكون لدينا تنظيم جيد للمعلومات. ومن ثم فإننا ~ 
ينبغي أن نرمي إلى التنظيم الجيد للمعلومات» حتى يكون بإمكاننا العثور على ما 
نبحث عنه في عالم المعلومات الرقمية. 
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الفصل الرابع 
اللغة في تنظيم المعلومات واسترجامها 


اللغة کا أشرنا بإيجاز في Y /۳ /١‏ مكون أساس في كل من تنظيم المعلومات 
واسترجاع المعلومات G)‏ صياغة الاستفسارات على سبيل المثال). وتتخذ اللغة في 
تنظيم المعلومات واسترجاعهاء شكل اللغة الطبيعية أو اللغة المقيدة. وحيث| يكون 
هناك خيار» فإن التساؤل يثار حول أي نوع من اللغة.يمكن للمرء أن يستخدم لتنظيم 
المعلومات واسترجاعها. 


اللغة الطبيعية: 

اللغة الطبيعية هي اللغة التي يتحدث بها ويكتب البشر. وفي اللغة الطبيعية لا 
يُبذل أي جهد في تنظيم المعلومات واسترجاعهاء للحد أو تحديد معام المفردات 
vocabulary‏ والنظم syntax‏ والدلالة csemantics‏ والعلاقات المتبادلة led‏ بين 
المصطلحات. ويسمى ما يستخدمه البشر من أجل تنظيم المعلومات أو صياغة 
الاستفسارات دون اللجوء إلى لغة مقيدة باللغة الطبيعية. 

وعادة ما تستعمل اللغة الطبيعية بثلاث طرقء لتنظيم المعلومات واسترجاعها. 
والطريقة الأولى هى استعمال المصطلحات الواردة في العناوين GLASS)‏ الكلمات 
المفتاحية في السياق Keyword In Context KWIC‏ على سبيل CJL‏ والجمل 
الملوضوعية أو عناوين الفقرات ctopic sentences‏ والمكونات المهمة الأخرى 
للوثيقة» لتنظيم المعلومات. والطريقة الثانية هي استعمال المصطلحات المستقاة أو 
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المشتقة من أي جزء بالوثيقة» لتنظيم المعلومات (كالتكشيف الاشتقاقي مثلا). أما 
الطريقة الثالثة فهي استعمال كلمات أو عبارات مقتطفة مباشرة من أسئلة المستفيدين» 
للتعبير عن الاستفسار» وهذا موضوع نناقشه في الفصل الخامس. 

وتتكون اللغة الطبيعية أساساء من نوعين من الكلمات؛ هما الكلمات المهمة 
والكلمات الوظيفية. والكلمات المهمة هي تلك المصطلحات التي تحمل glu‏ جوهرية 
أو مفاهيم موضوعية» بين تشمل الكلمات الوظيفية الأدوات» وحروف الجر 
والروابط «conjunctions‏ مغل“ an, a, the, and, for, of, to, this, that, her,‏ 
their‏ وعندما تستخدم اللغة الطبيعية في تنظيم المعلومات واسترجاعها آلياء عادة ما 
يتم إعداد قائمة بالكلمات المستبعدة stop-word list‏ (أو قائمة stop list lez!‏ 
Glew‏ وتختزن في النظام لتحول دون أن تصبح تلك الكلمات مصطلحات تكشيف 
أو مصطلحات استفسار. وتضم قائمة الاستبعاد جميع الكلمات الوظيفية المحتملة» 
بالإضافة إلى تلك المصطلحات المغرقة في العمومية أو المألوفة» على النحو الذي يحول 
دون صلاحيتها كمداخل للتنظيم. وأحيانا ما تسمى مثل هذه المصطلحات بالكلمات 
المهنية strade‏ فكلمة ال هندسة وحدها على سبيل المثال» قد تكون لا معنى لما 
كمصطلح كشفي أو مصطلح استفساره في مرصد بيانات هندسي. وتدخل 
اص طلحات lds‏ الطابع المؤقت «ephemeral‏ التي تعرف بالتعبيرات الطنانة 
45 في قائمة الاستبعاد أيضاء نظرا لأنها قد لا تصمد W gb‏ كم صطلحات 
تكشيف أو استفسار مرش حة. وتظهر معظم الكلمات الطنانة بوصفها تتصل 
بالتقنيات» على غرار الجوفر «gopher‏ وإنكار -denial of service “Sst‏ ولا 
يمكن GY‏ من الكلمات التي ترد بقائمة الاستبعاد» أن تستعمل لأغراض التنظيم أو 


() أو ما يقابل ذلك في أي لغة بالطبع. (المترجم) 
CO)‏ إحدى جرائم الإنترنت. راجع: إيان جيه. لويد. تشريعات تقنيات المعلومات. طه. ترجمة 
حشمت قاسم. القاهرة» المركز القومي للترجمة» قيد الطبع. (المترجم) 
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الاسترجاع. إلا أن كل نظام لاسترجاع المعلومات ينبغي أن تكون له قائمة الاستبعاد 
الخاصة به» التي يتم إعدادها خصيصا للنظام» من خلال النظر في المستفيد المستهدف 
وعوامل أخرى. 

dy‏ مقابل قائمة الاستبعاد. يمكن أيضا إعداد قائمة اعتبار list‏ مع لنظم 
استرجاع اللغة الطبيعنة )1992 (Rowley,‏ وجميع الكلات المهمة» فياعذدا 
المصطلحات المهنية والتعبيرات الطنانة» مرشحة لعضوية قائمة الاعتبار. وكقائمة 
الاستبعاد» فإن قائمة الاعتبار قائمة للقراءة بواسطة الآلات» ومن الممكن النظر فيها 
أثناء التنظيم والاسترجاع. وتبدو قائمة الاعتبار في اللغة الطبيعية بوجه عام أقل 
استعمالا في الغالب» من قائمة الاستبعاد» لسببين؛ أو أن قائمة الاستبعاد أقصر 
وأيسر في lb gli‏ ويمكن هذه التقنية أن تختبر بوجه عام» Jared‏ الله اليه 
في تنظيم المعلومات واسترجاعهاء وثانيهما أن قوائم الاعتبار تستعمل في غالب 
الأحيان» في نظم اللغات المقيدة» في شكل مكانز» وقوائم رؤوس موضوعات» 
وخطط تصنيف. 

وقد تزايد في السنوات الأخيرة استعمال قوائم الكلمات» بوصفها لغة شبه 
منضبطة» في نظم الاسترجاع الآلية. ونظرا OV‏ قوائم الكلمات غالبا ما تشتمل على 
مترادفات وأضداد للمصطلحات التي ترد في الوثائق» قلا تنطوي على ضبط آخر 
للغة» فإنها تبدو شكلا آخر لقائمة الاعتبار. وتنشئ بعض نظم استرجاع الإنترنت» 
وتحرص على صيانة قوائم كلمات أو قوائم اعتبار BY‏ الخاص. 


اللغة المقيدة: 
اللغة المقيدة controlled vocabulary‏ لغة اصطناعية.» حيث إن مفرداتها 


ونظمها csyntax‏ ودلالتها وسياقاتبا محدودة ومحددة المعالم )1995 -(Wellisch,‏ ومن 
الممكن للكلمة نفسها في لغات مقيدة مختلفة» أن تكون لما معان مختلفة تبعا لتوجه 
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اللغة. وينبغي أن يتم بناء اللغة المقيدة وصيانتهاء واضعين في الحسبان مجالا موضوعيا 
معينا أو عدة مجالات» ويتم انتقاء المصطلحات التي تدخل في اللغة المقيدة» باتباع مبدأ 
مسوغ الإنتاج الفكري أو المسوغ الأدبي «literary warrant‏ أو مسوغ المستفيد user‏ 
warrant‏ ويعني المسوغ الأدبي أن يتم اختيار المصطلحات التي تتضمنها اللغة 
المقيدة» من الإنتاج الفكري القائم. وعلى النحو نفسه» فإن مسوغ المستفيد يعني أن 
تكون المصطلحات التي يتم اختيارها لتتضمنها اللغة المقيدة» قد استعملت بالضرورة 
في الماضي. والمكانزء وقوائم رؤوس الموضوعات» وخطط التصنيف هي الأنواع 
الثلاثة الرئيسة للغات المقيدة. ١‏ 


المكانز: 
المكنز cthesaurus‏ لغة مقيدة للمصطلحات باللغة الطبيعية» يتم إعداده للربط 


اللاحق (National Information Standard Organization, post-coordination,‏ 
)1993. كذلك تعرف راولي )1992( Rowley‏ المكنز على النحو التالي: 


and‏ للكليات والعبارات» يبرز المترادفات وعلاقات 
التقسيم الهرمي» وغيرها من العلاقات والارتباطات» ومهمته 
توفير لغة معيارية لنظم اختزان المعلومات واسترجاعها. (P.‏ 
(252 


وينطوي الربط اللاحق على جهد بشري تحكمي 250821810120176 وهو أحدث 
بكثيز من لغات الربط المسبق epre-coordination‏ كخطط التصنيف. و تكفل لغات 
الربط اللاحق» كالمكانز مثلاء للمستفيدين القدرة على الربط بين المصطلحات أثناء 
التنظيم والاسترجاع. ووجه القصور الرئيس في الربط اللاحق هو الربط المزيف False‏ 
20 وكمثال على ذلك فان كلمتي ”تخاسب و مكتبت يمكن أن 
يرتبطا معا بشكلين؛ ”مكتب الحاسب“ و ”حاسب المكتب“ تبعا للمقصد الأصلي؛ 
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فإذا كان المقصود هو ”حاسب المكتب“ فإن نتائج الربط مشل ”مكتب الحاسب“ 
يمكن النظر إليها بوصفها ربطا مزيفا. 

وتستخدم الرموز notations‏ المعيارية في المكانز» لتحديد العلاقات التفريعية» 
والترابطية» والقائمة على الجناس أو المشترك اللفظي» وغيرها ما بين المصطلحات 
الواردة من علاقات. ويدل المختصران UF y USE‏ (يستعمل ل) على أي مصطلحات 
المكنز تعد واصفات مفضلةء ويحدد المختصر OLY) SN‏ المجال (scope note‏ معام 
معاني الواصفات. ويدل  NT‏ (مصطلح أضيق BT (narrower term‏ (مصطلح 
أعر ض (broader term‏ على العلاقات de Al‏ فيا بين الواصفات. ويتم التعبير عن 
علاقات التداعي أو الترابط associative‏ بين الواصفات بالرمز RT‏ (مصطلحات 
متصلة أو مرتبطة (related terms‏ وعادة ما ترتب المكانز هجائيا وهرميا. أما شكل 
العرض أو الترتيب الدوار أو التبادلي» أو النسقي أو التصنيفي» والتصويري 
graphic‏ فأحيانا ما نجده في مكانز معينة أيضا & (Aitchison, Gilchrist‏ 
.-Bawden, 1997)‏ 

والمكانز هي أكثر اللغات المقيدة المستعملة شيوعاء في تنظيم واسترجاع 
المعلومات غير الكتب؛ نظرا لدقتها ومرونتها وقدرتها على التعامل مع المفاهيم المركبة. 
وواصفات مكنز مركز ols gles‏ المصادر التربوية Educational Resources‏ 
«Information Center (ERIC)‏ مثال على ذلك. 


قوائم رؤوس الموضوعات: 

قائمة رووس الموضوعات» لغة مقيدة للمصطلحات في اللغة الطبيعية» يتم 
إعدادها لكل من الربط المسبق والربط اللاحق. ويجمع الربط المسبق الذي كان سائدا 
قبل أربعينيات القرن العشرين بين المصطلحات قبل Uae!‏ لأغراض التنظيم 
والاسترجاع. فإذا كان المرء ينوي» على سبيل المثال» تنظيم أو استرجاع وثائق حول 
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ola”‏ استرجاع الإنترئت internet retrieval systems‏ فإن العبارة المكونة من 
ثلاث كلمات» يمكن أن تظهر على وجه التحديد في صيغة مترابطة سلفاًء ومن ثم فإن 
اللغات المقيدة المترابطة مسبقا أو سلفاًء ليست تحكمية Uy nonmaipulative‏ كانت 
قوائم رؤوس الموضوعات تكفل كلا من الربط المسبق والربط اللاحقء LEP‏ تبدو 
أكثر مرونة من خطط التصنيف» ولكنها أقل مرونة من المكانز. 

وتسمى المصطلحات. في قوائم رؤوس المؤضوعات برؤوس الموضوعات» 
وترتب هجائيا. وتشمل الرموز بالنسبة لرؤوس الموضوعات» انظر esee‏ للإحالة من 
المصطلحات غير المفضلة إلى المفضلة» في حين يمثل × الذي يعني “انظر من“ See‏ 
۲٠١‏ التعبير المقابل لإحالة ob)”‏ كما في ”معاق “handicapped‏ انظر اا 
بدنيا yc “physically challenged‏ ”عاجز “Glee” bil “Lin‏ وهناك Le got‏ 
أخرى من الرموز الخاصة بقوائم رؤوس الموضوعات» تشمل ”انظر أيضا see‏ 
“also‏ و XX‏ الذي يفيد ”انظر أيضا من esee also from‏ وتدل إحالة ”انظر أيضا 
“see also‏ على كل من العلاقات التفريعية والترابطية بين رؤوس الموضوعات 
التي يقع عليها الاختيار. إلا أن ذلك الأسلوب ينال من مدى تخصيص قوائم رؤوس 
الموضوعات ودقتها. وعلى غرار الرمز X‏ يدل XX‏ على التعبير التقابلي لعبارة 
انظر أيضا. 

وتستعمل قوائم رؤوس الموضوعات» بوجه عام» لكل من تنظيم المعلومات 
واسترجاعهاء على الرغم من أنه قد يبدو Ll‏ تستخدم على نحو قل من المكانزء 
لأغراض تنظيم واسترجاع المعلومات غير الكتب. وقائمة سيرز لرؤوس الموضوعات 
Sears List of Subject Headings‏ من أمثلة هذه القوائم. والمثال الآخر الشهير هو 
رؤوس موضوعات مكتبة الكونجرس  Library of Congress Subject‏ 
Headings‏ التي تبدو رموزها في الطبعة الحادية عشرة أقرب شبها بالمكانز. 
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خطط التصنيف: 

خطة التصتيف» لغة مقيدة من مصطلحات في شكل هجائي رقمي» توضع في 
المقام الأول للربط المسبق. وتسمى الوحدات في خطط التصنيف بالفئات classes‏ 
التي تميز بعد ذلك رقمياء أو هجائياء أو هجائيا رقميا. وبوصفها أول أنواع اللغات 
المقيدة التي تم وضعهاء شهدت خطط التصنيف» وعايشت تغيرات عدة» طوال 
القرون الماضية. ومن ناحية أخرى يتم تحديث هذه الخطط ومراجعتهاء مرارا وتكرارا 
بمرور الوقت. 

وعلى عكس المكانز» فإن قوائم رؤوس الموضوعات وخطط التصنيف» يتم 
بناؤها وفقا لإطار اصطناعي للمعرفة. فقد جنح تصنيف ديوي العشري» على سبيل 
المثال» لتقديم dle‏ المعرفة على أساس عشرة أقسام. ويتم تشكيل عشر فئات على وجه 
التحديد» عند كل مستوى للتفريع في إطار الخطة, الأمر الذي يدل على جمود النظام. 
ويتم إبراز العلاقة التفريعية بين الفئات باستعمال مسافات أو أبعاد Lake‏ لرموز 
التصنيف؛ أي ai]‏ كلما طال رمز التصنيف» ازداد عمق مكان الفئة في البنيان المرمي. 
ويتم إبراز العلاقات الترابطية بين المصطلحات عن طريق أسلوب ”انظر“ و bas”‏ 
أيضا“ الذي لا يستخدم إلا عرضا. 

وغالبا ما يتم اختيار خطط التصنيف تقليدياء لتنظيم واسترجاع معلومات 
الكتب. وتصنيف ديوي العشري» وتصنيف مكتبة الكونجرس مثالان 
لخطط التصنيف. 


المكانز في مقابل قوائم رؤوس الموضوعات وخطط التصيف: 

يلخص الجدول رقم ١ /٤‏ خصائص كل من هذه الأنواع الثلاثة للغات 
المقيدة. وبالإضافة إلى ما تمت مناقشتهء فإن طريقة التحليل خاصية أخرى ترتبط 
باللغات المقيدة. ويعني enumeration padl‏ بوصفه طريقة للتحليل» ببساطة» توفير 
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قائمة بالمصطلحات دون القدرة على الربط فيا بينهاء للتعبير عن شيء ما أكثر تعقدا. 
أما التركيب synthesis‏ فيكفل» على العكس» الربط بين بعض المصطلحات» لتكوين 
مصطلحات أكثر تعقداء في مرحلة التنظيم أو المدخلات» أو في مرحلة إجراء عمليات 
البحث والاسترجاع )1986 (Lancaster,‏ وترتبط طريقة التحليل ارتباطا Liss‏ 
بطريقة الربط. أي أن لغة الربط المسبق حصرية» بينا لغة الربط اللاحق تحليلية 
تركيبية» كذلك تحدد طرق التحليل والربط مدى تخصيص اللغة المقيدة ومرونتها. 
وتبدو اللغة التحليلية التركيبية ولغة الربط اللاحق أكثر تحديدا أو تخصيصا وقابلية 
للاستيعاب من اللغة ا لحصرية أو لغة الربط المسبق. 

ووفقا للجدول رقم ١/٤‏ تبدو المكانز أكثر تخصيصا ومرونة من خطط 
التصنيف» ley‏ تقع قوائم رؤوس الموضوعات في مرتبة وسط بينهما على هذا الطيف. 
الأمر الذي يفسر السبب في أن تصبح المكانز أوسع اللغات المقيدة انتشارا 
في الاستخدام. 


اللغة الطبيعية في مقابل اللخة المقيدة: 

ناقش القسان السابقان ملامح وخصائص كل من اللغة الطبيعية واللغة 
المقيدة. وآن الأوان للنظر في أوجه الاختلاف فيا بينهماء والقاسم المشترك بينها 
كلغات لتنظيم المعلومات واسترجاعها. 
الحقب المختلفة للغات تنظيم المعلومات واسترجاعها: 

تعد اللغات المقيدة» في تاريخ تنظيم المعلومات واسترجاعهاء وافدا جديدا 
بالمقارنة باللغة الطبيعية. ومن الممكن التحقق من معالم أربع حقب في تطور لغات 
تنظيم المعلومات واسترجاعها حتى الآن. 
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وتدل الحقبة الأولى على زمن ما قبل ظهور أي لغة مقيدة. فقد كانت اللغة 
الطبيعية هي اللغة الوحيدة المستخدمة؛ [ng‏ كان تنظيم المعلومات واسترجاعها 
يتشكل كمجال موضوعي. وبدأ الناس يدركون أوجه القصور (كالمشترك اللفظي 
والمترادفات مثلا) في اللغة الطبيعية» عندما كانت تستعمل لتنظيم المعلومات 
واسترجاعها. 


Joi 


رموز الإحالات U, UF, SN,‏ انظر» انظر 
مد | BT, NT, RT‏ أيضا 
Say‏ ته اله 

a‏ | اتات ا 


الكتب 
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وتدل الحقبة الثانية على دخول اللغة المقيدة إلى تنظيم المعلومات و استرجاعها. ففي 
البداية كانت نظم الربط المسبق كخطط التصنيف» تستخدم بكثافة. ثم ظهرت أنواع أخرى 
من اللغات المقيدة» وهي قوائم رؤوس الموضوعات والمكانز في) بعد. وقد تعايش كلا 
النوعين من لغات تنظيم ا معلومات واسترجاعهاء في هذه الحقبة» مع الميل نحو اللغة المقيدة. 
كذلك بدأ الجدل حول اللغة الطبيعية في مقابل اللغة المقيدة حينئذء ولا يزال متواصلا. 

وتتميز الحقبة الثالثة بنهضة اللغة الطبيعية من جديد» نتيجة لأساليب استرجاع 
الكلمات المفتاحية» وتطؤر نظم النصوص الكاملة. ولا تزال اللغة المقيدة تستخدم” 
لتنظيم المعلومات واسترجاعهاء ولكن في نظم الاسترجاع الوراقية (الببليوجرافية) في 
الغالب الأعم. فهل يمكن للغة المقيدة أن تظل لغة صالحة لتنظيم المعلومات 
واسترجاعها؟ فقد ثار الكثير من الجدل في تلك الحقبة فيا يتعلق باللغة الطبيعية في 
مقابل اللغة المقيدة. 

ثم بدأت الحقبة الرابعة» عندما بدأ استعمال واجهات التعامل باللغة الطبيعية في 
تنظيم المعلومات واسترجاعهاء واستخدام تقنية لغة مقيدة خلف ستار. ونظرا ON‏ 
نبج اللغة المقيدة لا يمكن رؤيته من جانب المستفيد النهائي» فقد أسمتها ميلستيد 
Milstead (1995)‏ اللغة المقيدة الخفية في بيئة استرجاع اللغة الطبيعية. ومن بين 
الأمثلة على ذلك إخفاء اللغة المقيدة وراء غلاف shell‏ اللغة الطبيعية. وقد أسهمت 
مظاهز التقدم في معالجة اللغة الطبيعية» على نحو ملحوظ Laf‏ في هذا التطور. وقد 
بدأت بعض نظم استرجاع المعلومات» كنظام وست المسمى ون West's WIN‏ 
(وستلو طبيعي (Westlaw is Natural‏ تقدم خدمات ful‏ جاع باللغة الطبيعية. 

وعلى الرغم من أن الحدود الفاصلة بين مختلف الحقب» لا تبدو على قدر كبير 
من الوضوح والتحديد, فإن لغة تنظيم المعلومات واسترجاعهاء قد اجتازت بجلاء 
الحقبتين الأوليين» وتمر OVI‏ بالحقبتين الثالثة والرابعة. 
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لماذا اللغة الطبيعية أم لماذا اللغة المقيدة؟ 

ينبغي أن تكون هناك أسباب وراء تعايش اللغة الطبيعية مع اللغة المقيدة» في 
تنظيم المعلومات واسترجاعها. ولا تخرج الأسباب عن وجهات النظر المؤيدة 
ووجهات النظر المعارضة لكلا النوعين من لغات تنظيم المعلومات واسترجاعها. 
قضية الترادف: 

قضية المترادفات إنحدى أكثر الحجج التي تساق ضد استعمال اللغة الطبيعية» في 
تنظيم المعلومات واسترجاعها؛ فالمترادفات في اللغة الطبيعية مصطلحات مختلفة 
تؤدي المعنى نفسه. فالحاسبات المصغرة «emicrocomputers‏ والحاسبات الشخصية 
«personal computers‏ وبي مي PCS‏ و سطح المكتب wl Sally «desktop‏ 
«notebooks‏ وسطح الركبة م0]م13» وما هو على شاكلتها مترادفات”. إلا أن ol‏ 
مصطلح في هذه القائمة الجزئية يمكن أن يقع عليه الاختيار» ويستعمل لأغراض 
تنظيم المعلومات واسترجاعها؟ وهذه إحدى قضايا الجدل حول لغات تنظيم 
المعلومات واسترجاعها. وعندما تكون اللغة المقيدة هي لغة تنظيم المعلومات 
واسترجاعهاء التي وقع عليها الاختيار» فإن المترادفات لا تصبح مصدرا للمخاوف» 
OY‏ مصطلحا واحداء وواحد فقط هو ما يقع عليه الاختيار في LAU‏ المقيدة بوصفه 
المصطلح المفضل. أما بقية المترادفات فتعامل بوصفها مصطلحات غير مفضلةء ويحال 
منها إلى المصطلح المفضل. 


(*) مثال غير موفق للأسف. لأن البي سي اختصار مباشر للحاسب الشخصيء والمفكرات وسطح 
الركبة وغيرهاء من الحاسيات المحمولةء وإن كانت تستخدم لأغراض شخصيةء تختلف عن 
الشخصي وسطح المكتب» ومن ثم فإنه يمكن النظر إلى هذه المصطلحات بوصفها أشباه 
مترادفات. (المترجم) 
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قضية المشترك اللفظي: 

تبدو الكليات المتفقة شكلا المختلفة معنى chomographs‏ الناتجة عن الظاهرة 
المعروفة بتعدد المعانى cpolysemy‏ حجة أخرى: غالبا ما تساق في الجدل حول اللغة 
الطبيعية في مقابل اللغة المقيدة. ويعنى المشترك اللفظي أو الجناس» وجود مصطلحات 
هجاؤها واحد ولکنها تحمل معان مختلفة في السياقات المختلفة. ومصطلحات مثل srecord‏ 
duty y bank s «spring s «drug y «subjects‏ جرد أمثلة قليلة للمشترك Č Bai‏ وفي 
اللغة الليعية ف fay Cole pal oli‏ جا EEEE ft alloy Sy‏ 
السياق» أن يسفر عن مشكلات كالغموض مثلا. وقد تبين للاتكستر وورنر Lancaster‏ 
and Warner (1993)‏ أن مشكلة الغموض في الاسترجاعء الناتجة عن المشترك اللفظي 
غالباء ما تكون نظرية أكثر منها فعلية» نظرا لأن الكلمات التى يمكن أن تكون غامضة في حد 
ذاتهاء لا تصبح كذلك عندما تستعمل مرتبطة بكلمات أخرى””. حقا يمكن للم شترك 
اللفظي ألا يصبح غامضا في معناهء إذا ما استعمل مرتبطا بكلمات أخرى. إلا أن الارتباط في 
الاستعمال قد يحدث أو لايحدث في اللغة الطبيعية لتنظيم المعلومات واسترجاعها. وفي 
مقابل ذلك» فإن السياق اللازم لتفسير المشترك [Sloe eal‏ ما يتوافر عن طريق وسائل 
مختلفة في اللغة المقيدة. ومن بين الوسائل المألوفة استعمال الأقواس لتخديد سياق المشترك 
اللفظي» |S‏ في duty‏ (المسئولية) ولاناك (الضرائب) “. 


قضية OPP) LES‏ 
للغة ظمهاء ولكن كيف يمكن التعبير عن النَظْم syntax‏ عندما يقع الاختيار 
على اللغة الطبيعية لتنظيم المعلومات واسترجاعها؟ هب أن وثيقة ما تم تمثيلها 


C 3‏ يناظر ذلك في e rere "de pall‏ (المترجم). 

C)‏ أي عندما توضع في سياق معين. (المتر 

CO")‏ يقصد بذلك تحديد المجال الموضوعي es‏ الكلمة. (المترجم) 

C4 5‏ النحو grammar‏ مستويان؟ الصرف morphology‏ أي بناء ALAS‏ والنظم syntax‏ 
أي بناء العبارة أو الجملة. ؤهناك من يستعمل ”النحو“ مقابلا لكلمة ” syntax’‏ إلا أننا نرى 
في ذلك ما GE‏ مقتضيات الدقة. (المترجم) 
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با صطلحات LS‏ ”الولايات المتحدة الأمريكية “USA‏ و”السيارات 
“automobiles‏ و “Vapan SLL”‏ فى اللغة الطبيعية؛ فهذه الوثيقة يمكن أن تدور 
على سبيل المثال» حول تصدير اليابان ليان ات إلى الولايات المتحدة الأمريكية» أو 
العكس» تصدير الولايات المتحدة للسيارات إلى اليابان. ومن غير الواضح أي دولة 
هي sual‏ عندما ترد هذه المصطلحات الثلاثة فقط دون أي معلومات عن Š‏ 
ومن الممكن حل هذه المشكلة بسهولة في اللغة المقيدة» بوسائل كالأدوار TOMES‏ وهي 
رموز أو أرقام تدل على العلاقة النظمية بين المصطلحات. ومن الممكن في هذا SLM‏ 
تعريف الرقم ١‏ بوصفه دور المصدّرء ثم نضعه بعد المصطلح ”اليابان Japan‏ أي - 
Japan (1)‏ وعلى النحو نفسه يمكن تسمية الرقم ۲ بوصفه دور المستورد» ثم نعينه 
للمصطلح USA‏ أي )2( USA‏ ومن OLS‏ مثل هذه الطريقة المتبعة في اللغة المقيدة» 
أن تكفل لنا التغلب على قضية التظم» بين| لا تكفل اللغة الطبيعية ذلك. 
قضية الدقة: 

[Bb‏ ما يكون من المرغوب فيه» أن تكون هناك لغة لتنظيم المعلومات 
واسترجاعهاء يمكن أن تعبر بدقة عن المعلومات واستفسارات البحث. ويبدو هذا 
الهدف قابلا للتحقيق إذا ما وقع الاختيار على اللغة الطبيعيةء بوصفها لغة لتنظيم 
المعلومات واسترجاعها. والمبرر المنطقي هذه العبارة ثنائي الأبعاد؛ أولاء لا حاجة إلى 
معالجة إضافية (كالشرح مثلا) إذا ما استعملت اللغة الطبيعية للتنظيم والاسترجاع» 
ثانيا لا ضرورة للتفسير عند استعمال اللغة الطبيعية في التنظيم والاسترجاع, OY‏ ما 
يستعمله المؤلف أو المستفيد إنم| هي اللغة التي تستعمل في تنظيم المعلومات 


C)‏ ربا يدرك الناطقون بالعربية مدى عبقرية نظام النحو العربي المرتبط بالدلالة؛ إذ لا يمكن معرفة 
معنى الكلمة على وجه التحديد إلا بإعراءها أي بيان موقعها في الجملة. والقراءة السليمة مرتبطة 
بالإعراب. les‏ يدل ذلك على مدى ما فقدت اللغة العربية نتيجة لتجاهل الحركات في معظم 
النصوص المطبوعة. (المترجم) 
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واسترجاعها. وبالمقارنة» فإن اللغة المقيدة اصطناعية» ولا تدل على ثراء اللغة 
الطبيعية» التي تستعمل في إنشاء الوثائق والتعبير عن استفسارات البحث. كذلك 
تفتقر اللغة المقيدة أيضا إلى التحديد أو الدقةء نتيجة لما تتعرض له في عملية MALU‏ 
ويبدو تفسير اللغة المقيدة أمرا لا غنى عنه؛ نظرا OY‏ مضمون كل مصطلح ودلالته إن 
تتحدد معالمهها بوضع متلق مستهدف بعينه في الحسبان. ويمكن لمثل هذا التفسير أن 
يفضي le‏ إلى عدم الدقة في لغة التنظيم والاسترجاع التي تعتمد على اللغة المقيدة”. 
قضية التحديث: 

لا تحتاج اللغة الطبيعية إلى أي تحديث updating‏ بينم| تحتاج اللغة المقيدة إلى 
ذلك؛ فمن الممكن للمصطلحات الجديدة أن تستعمل لأغراض تنظيم المعلومات 
واسترجاعها بمجرد أن ترد في اللغة الطبيعية» ley‏ لا يمكن حدوث أي تغيير في اللغة 
المقيدة» إلا حين تعرضها لعملية التحديث الجامدة المطولة. ومن ثم فإن المصطلحات في 
اللغة المقيدة ليست حديثة على الدوام. ولا يمكن بحال الرد على الاستفسارات التي 
تتضمن مصطلحات جديدة» إذاماوقع الاختيار على اللغة المقيدة للتنظيم 
والاسترجاع' ". 


)*( هناك من يرى أن تدخل اختصاصيي المعلومات وجهدهم في وضع اللغات BAA‏ با 
ينطوي عليه من تحكم» من شأنه أن يؤدي إلى شيء من الشوشرة في نظام التواصل بين المصدر أو 
المنشئ من جهة والقارئ أو المتلقي من جهة أخرىء نتيجة لإضافة بعض الملامح أو الخواص 
الاصطناعية» التي قلا تكون محل اتفاق بين الطرفين. (المترجم) 

() يعني ذلك أنه تظل هناك [slo‏ فجوة معجمية بين | للغة الطبيعية التي تستعمل للتعبير عن 
. الأفكار والمفاهيم من منشئهاء واللغة المقيدة. فقد تستعمل مصطلحات جديدة في اللغة الطبيعية لا 
تستوعبها اللغة المقيدة إلا بعد حين طال أو قصر. (المترجم) 
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az 5‏ التكلفة: 
يستنفد إنشاء وصيانة اللغة المقيدة للتنظيم والاسترجاع» واكتسناب القدرة على 
استع لها وقتاً لا يستهان به. ومن شأن هذا الوقت اللازم هذه الأنشطة؛ أن يترجم في 
النهاية إلى تكلفة في تنظيم المعلومات واسترجاعها. وفي مقابل ذلكء فإن اللغة 


واسترجاعها باللغة الطبيعية أي تدريب أو صيانة. 


قضية التوافق: 

يحدث في بعض الأحيان أن يصبح نظام اختزان المعلومات واسترجاعهاء 
بحاجة لتغيير لغته في أثناء تطويره؛ أو عندما يرغب أحد المستفيدين في إجراء عملية 
البحث نفسها في عدة مراصد بيانات. وهكذا تبرز قضية التوافق أو التناغم 
compatibility‏ بالنسبة للغة المقيدة؛ نظرا OY‏ لكل لغة مقيدة. عقوماتها وخصائصها 
المتميزة. ويبدو من المستحيل» على سبيل المثال» استخدام تصنيف ديوي العشري» 
لإنجاز مهام تنظيم واسترجاع» في فهرس متاح للجمهور على الخط المباشر (OPAC)‏ 
اختار تصنيف مكتبة الكونجرس بوصفه لغته المقيدة. وإذا كانت النظم قائمة على 
اللغة الطبيعية» فإنه يمكن حينئذ للتحول أو الانتقال من نظام إلى آخر» أن يكون 
LL‏ على الدوام» OY‏ اللغة الطبيعية ينبغي أن تكون دائ) متوافقة مع نفسها. وتسمى 
هذه القضية بقضية القابلية للتشغيل التبادلي» باستعارة المصطلحات المستعملة 
في النظم الإلكترونية )2004 (Zeng & Chan,‏ وعلى النحو نفسه أصبح ”نظم 
idles‏ المعرفة “knowledge organization systems‏ مصطلحا جديدا بالنسبة 
للغات المقيدة. 
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وقصارى القولء فإن مظاهر قوة اللغة المقيدة في الترادف» والمشترك اللفظيء 
الضعف في اللغة المقيدة وهى الدقق والتحديث» والتكلفة» والتوافق» نقاط القوة 
بالنسبة للغة الطبيعية. وكا كررت راولي )1994( Rowley‏ مراراً في أحد أعماها: 
هناك Gl fel‏ عام بأن كلا من اللغة المقيدة واللغة الطبيعية 
ينبغي [blared‏ مرتبطتين معاء LS‏ أن هناك شيء من الاتفاق حول 
المزايا النسبية لكل من النظامين. )116 (p.‏ 
وبعبارة أخرىء OB‏ كلا من اللغة الطبيعية واللغة المقيدة» قد وجدت مكاهها في 
تنظيم المعلومات واسترجاعهاء ولكن هل سيستمر الأمر كذلك؟ 


اللغة لأغراض تنظيم المعلومات واسترجاعها في الحصر الرقمي: 

تستخدم كل من اللغة المقيدة واللغة الطبيعية بالتوازي» لتنظيم المعلومات 
واسترجاعها في البيئة الورقية. وفي عالم الخط المباشرء لا تزال هناك حاجة للتدخل 
البشري العميق في تنظيم المعلومات واسترجاعها؛ إذ تحتل اللغة المقيدة الموقع المسيطر 
كلغة للتنظيم والاسترجاع: dy‏ العصر الرقمي أصبحت اللغة الطبيعية هي القاعدة 
بالنسبة لتنظيم المعلومات واسترجاعهاء ley‏ لا تستعمل اللغة المقيدة إلا عرضا أو على 
نطاق ضيق جداء نظرا للخواص الفريدة للمعلومات الرقمية. 

وتتوافر على الإنترنت نسبة مئوية ضخمة من المعلومات الرقمية» بينما تبدو 
تقنيات ضبط da dl‏ غائبة» ومتوسط العمر الافتراضى للمعلومات قصير» في حين 
ينمو كم المعلومات tad‏ ومن ثم فإن أي استخدام للغة المقيدة: باهظة التكلفة في 


(*) يتضاعف كل فترة زمنية معينة» أي ينمو بمتوالية هندسية. Cpr Al)‏ 
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البيئة الرقمية لتنظيم المعلومات واسترجاعهاء يتطلب تبريرا وترشيدا. ولا تستخدم 
نظم استرجاع الإنترنت الشهيرة» التي تتكفل بمعظم مهام تنظيم المعلومات 
واسترجاعها على الإنترنت» اللغة المقيدة على الإطلاق. ويبدو استعمال قوائم LST‏ 
من جانب قليل من نظبم استرجاع الإنترنت» أقرب شيء للغة المقيدة في تنظيم 
المعلومات الرقمية واسترجاعها. 

غير أن اللغة الطبيعية لا يمكن أن تكون اللغة الوجيدة لتنظيم المعلومات 
واسترجاعها في البيئة الرقمية» نظرا OV‏ الافتقار إلى ضبط اللغة أو التحكم فيها يمكن 
أن يكون واحدا من الأسباب الجوهرية لإنخفاض جودة نتائج أو حرجات نظم 
SS‏ تتخول من he ene‏ 
كاهل اختصاصيي المعلومات» إلى كاهل المستفيدين النهائيين» عندما يقع الاختيار على 
اللغة الطبيعية لتنظيم المعلومات واسترجاعها. إلا أنه عند استعمال اللغة المقيدة 
رسمياء فإن مهمة ضبط اللغة ينبغي أن تقع على عاتق اختصاصيي المعلومات. ومالم 
يحدث ذلك فإن المستفيد النهائي ينبغي أن ينهض بدور ضبط اللغة على نحو غير 
رسميء وذلك على سبيل المثال» بالتفكر في المصطلحات المترادفة التي تدعو الحاجة 
إليهاء في صياغة استفسارات البحث. ولا ينبغي أن يصبح التفاعل المتزايد بين المستفيد 
النهائي ونظام استرجاع المعلومات. في البيئة الرقمية» ذريعة لإلقاء عبء ضبط اللغة 
als fo‏ اليد وان لطر الاك ara olay‏ 
النهوض بمهمة متواضعة في هذا الصدد. 

إت كيه نكن أن Dy Sy‏ تيل LAD‏ اة كلع لطي ارماك 
واسترجاعها في العصر الزقمي؟ ولا تبدو الإجابة عن هذا السؤال مؤكدة على 
الإطلاق. وبنظرة فيا مضى يبدو أن هناك أربع طرق مختلفة يمكن بها استعمال اللغة 
المقيدة في تنظيم المعلومات واسترجاعها )1993 :(Lancaster & Warner,‏ 
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Jeata-‏ اللغة المقيدة لكل من التنظيم والاسترجاع. 
SAU Seca ١‏ اليف لكل op‏ لكلف E‏ رجا oy Sy‏ اة 
أدوات اللغة المقيدة» كالأدوار والربط المسبق. 
-Y‏ استعمال اللغة المقيدة للتنظيم فقطء أما الضبط من أجل الاسترجاع فيتم 
بوسائل أخرى كاللغة المقيدة الكامنة أو غير المرئية في النظام. 
4. استعمال اللغة المقيدة للاسترجاع فقط. ويتم تطبيق هذا النهج باستعمال 
مكنز البخث فقطء الذي يعرف أيضا بلغة الربط اللاحق. 
وعند النظر في خصائص تنظيم المعلومات واسترجاعها في البيئة الرقمية» يبدو 
النهج الثاني AST‏ جدوى من غيره. فكل من النهج الثالث والرابع يختزنان لغة مقيدة 
على الخط المباشر من أجل المراجعة أو البحث. الأمر الذي يبدو أيضا خيارا مناسبا 
لاستخدام اللغة المقيدة. ومن ناحية أخرى» شهد مجال تنظيم المعلومات واسترجاعها 
في السنوات الأخيرة» بروز أطر لغوية كالتقسيرات الحرمية taxonomies‏ 
و التصنيفات المتعارف عليها folksonomies‏ والتصنيفات التخصصية „ontologies‏ 
وعلى الرغم من أن لكل إطار خصائصه الفريدة» فإنها جميعا قد تطورت لأغراض 
التنظيم والاسترجاع في العصر الرقمي. 
التقسيمات الهرمية: 
نش مصطلح التقسيم الهرمي taxonomy‏ الذي ناقشناه بإيجاز في Y/Y‏ 
كتركيب مزجي من الكلمتين اليونانيتين taxis‏ (بمعنى نظام أو ترتيب) nomos‏ 
(بمعنى قانون أو علم). وكان التقسيم ال هرمي يدل في البداية على تصنيف الكائنات 
الحية (كالحيوانات والنباتات على سبيل ا مخال). إلا أن هذا المصطلح يكتسب الآن 
معنى أكثر اتساعا وأكثر عمومية تما كان من قبل؛ إذ يعرف الآن بأنه تصنيف جميع 
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الأشياءء ا يمتد معناه ليتجاوز حدود التغطية السابقة للكائنات الحية. وكا ذهب 
جلكرست )2003( Gilchrist‏ فإن أقدم إشارة إلى الاستعمال الحديث للم صطلح 
ظهرت عام ۱۹۹۷ في مقالة حول ياهو! Yahoo!‏ أحد نظم استرجاع الإنترنت» الذي 
يستمد جذوره من خدماته الإرشادية القائمة على التقسيم الهرمي الذي اشتهر به. 

وتمتد جذور التقسيمات اطرمية في الواقع إلى كل من خطط التصنيف والمكانز. 
وكا هو الحال في خطط التصنيف» فإنها تعبر عن العلاقات اهرمية فيا بين الفئات» أي 
الوحدات الأساس للتقسيم الهرمي» بمستويات مختلفة للعرض» ولا تستعمل 
الأشكال الحجائية الرقمية للرموز» وسيلة التصنيف المألوفة. في التقسيرات الحرمية. 
ويتم التعبير عن العلاقات الترابطية فيم] بين الفئات هجائيا عند كل مستوى» على نحو 
oly SE‏ إحدى طرق العرض المألوفة في المكانز. إلا أنه على عكس خطط 
التصنيف والمكانزء لا تكفل التقسيمات الحرمية أي وسيلة للإحالةء الأمر الذي ينتقص 
من الوظيفة التي يفترض للغة المقيدة أن تتكفل بها. 

وتستخدم التقسيمات ال هرمية التي تتحدد معالمها بخواصهاء بوجه عام لتقسيم 
المعلومات إلى فئات» ودعم التصفح» أحد طريقتي الاسترجاع. وتبدو هذه التقسيمات 
جاذبة بوجه خاص بالنسبة لمرافئ portals‏ معلومات المشروعات» من أجل 
احتياجاتها لتنظيم المعلومات واسترجاعها )2003 (Gilchrist,‏ بالإضافة إلى تنفيذها 
على الإنترنت. ومن بين الأسباب الكامنة وراء هذا الضرب من الاهتام» قدرة 
التقسيمات dye bl‏ على استيعاب اللغات المختلفة» التي يمكن أن تتوافر في المشروع. 
يضاف إلى ذلك أن بناء تقسيم هرمي وصيانته عادة ما يكون أيسر نسبيا وأقل تكلفة 
من توفير لغة مقيدة تقليدية كالمكنز مثلاء عندما تكون عمليات الدمج والإضافة» تتم 
بكثافة في Jle‏ نشاط المشروع. وقد درس كل من وانج وتشوذري وخو Wang,‏ 
Chaudhry and Khoo (2006)‏ التوقعات المحتملة الأخرى بالنسبة للتقسييات 
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الهرمية في تنظيم المعلومات واسترجاعها. إلا أن أشهر مثال للتقسيم ال هرمي» هو ذلك 
المستخدم E‏ تجميع دليل يأهو! .(dir.yahoo.com) Yahoo! Directory‏ 
التصنيفات المتعارف عليها: 

كا ألمحنا في ۲/ ct /١‏ فإن التصنيف المتعارف عليه folksonomy‏ يمكن 
النظر إليه بوصفه (audi‏ هرميا ينشئه الجمهور أو المستفيدون )2007 (Vander Wal,‏ 
ومن ناحية أخرى يبدو التصنيف المتعارف عليه متصلا اتصالا وثيقا بالتمييز 
الاجتماعي csocial tagging‏ وهو في جوهره؛ ناتج جانبي للتمييز الاجتهاعي» نظرا 
لأنه يبنى بتيجان 1885 يختارها المستفيدون أثناء عملية التمييز. 

وعادة ما تتخذ التصنيفات المتعارف عليها شكل سحابة التيجان stag cloud‏ 
وهي تجمع مرئي للتيجان التي يتم إنشاؤهاء في موقع تمييز قائم على ترددات التيجان. 
وسحب التيجان» والتصئيفات المتعارف عليهاء إذا أردنا الدقة مترادفان. وعلى عكس 
التقسييات ال هرمية» فإن التصنيفات المتعارف عليها لا تظهر أي علاقات هرمية فيا بين 
مكوناتهاء وهي التيجان على وجه التحديد. وما تتم المحافظة عليه في التصنيفات 
المتعارف عليهاء هو العلاقة الترابطية بين التيجان» مسجلة بترتيب هجائي» دون أي 
من رموز الإحالات» التى غالبا ما تطبق 3 اللغة المقيدة التقليدية (كالمكنز مثلا). ومن 
ثم فإن التصنيفات المتعارف عليها لا يمكن أن تعامل بالطريقة نفسهاء التي تعامل بها 
اللغات المقيدة الأخرى. التى تناولناها فعلاء من حيث تكوينهاء وبنيانها ووظيفتها. 

وفضلا عن ذلك» op‏ جميع اللغات المقيدة» من خطط التصنيف إلى التقسييات 
الهرمية» عادة ما يتم تطويرها بواسطة اختصاصبي المعلومات. وفي مقابل ذلك فإن 
التصنيف المتعارف عليه ضرب جديد من لغات تنظيم المعلومات واسترجاعهاء ينشئه 
المستفيدون النهائيون لأنفسهم دون سواهم» في حركة الجيل الثاني للعنكبوتية Web‏ 
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0 التي لا حدود لها من حيث الموضوع أو الثقافة أو الجغرافيا (Munk & Mork,‏ 
)2007. وفي أثناء التمييز يمكن للمستفيدين اختيار تيجان من أي تصنيف متعارف 
cade‏ ولكن تظل لهم حرية اختيار أي مصطلحات من لغتهم هم كتيجان. ونظرا OY‏ 
جميع التيجان في التصنيفات المتعارف عليها تربطها روابط فائقة» فإن هذا النظام يكفل 
للمستفيدين القدرة على تصفح ما هو متاح في موقع تمييز tle‏ عن طريق تيجان مرتبطة 
بروابط فائقة» إلى جانب البحث أو التنقيب. 

وقد نوقشت مزايا وأوجه قصور التصنيف المتعارف عليه كلغة لتنظيم 
المعلومات واسترجاعهاء باستفاضة من جانب كثير من الباحثين ( :2006 Noruzi,‏ 
Speller, 2007; Spiteri, 2007; Trant, 2006‏ على سبيل المثال)» وذلك من منظور 
التصنيفات المتعارف عليها فقطء أو بالإشارة إلى اللغات المقيدة التقليدية. وقصارى 
القول» فإن التصنيفات المتعارف عليها قد ورئت جميع ما للغة الطبيعية وماعليهاء 
بالإضافة إلى إحدى الخواص الإضافية للغة المقيدة» ألا وهي الترتيب ال هجائي 
2 للتيجان. القائم على التردد. وبذلك المعنى» فإن التصنيف المتعارف 
عليه يستعمل كلغة طبيعية AST‏ من استعماله كلغة مقيدة» في البيئة الرقمية لتنظيم 
المعلومات واسترجاعها. ومن الممكن العثور على مثال للتصنيف المتعارف عليه في 
موقع Delicious.com‏ عندما يتم تصوير إحدى سحب التيجان. 


التصنيفات التخصصية: 


يتم مصطلح علم الوجود contology‏ المستعار من FSER SLE‏ بدراسة 
الكينونة أو الوجود. وقد لجأ الباحثون في الذكاء الاصطناعي إلى هذا.المصطلح في 
ثانينيات القرن العشرين» للدلالة على اكتساب المعرفة والتعبير عنهاء عندما يكون 
المرء بصدد وضع تصور نظري لمجال ماء في تصميم وتنفيذ النظم الخبيرة (Vickery,‏ 
(1997. وعادة ما يعرف الوجود أو التصنيف التخصصي» في هندسة المعرفة» أو في 
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مفاهيمي أو نظري conceptualization‏ مشترك )1993 (Gruber,‏ 


ومن ناحية أخرى تبنى برنرز-لي» وهندلر ولاسيلا Berners-Lee,‏ 
Hendler, and Lassila (2001)‏ هذا ال صطلح» عند وضع تصور العنكبوتية 
الدلالية. وهذا موضوع نستكشفه في TV‏ وني هذه البيئة على وجه التحديدء 
ينفصل الوجود فعلا عن أصله في الفلسفة» ويحظى بالترحيب بوصفه لغة لتنظيم 
المعلومات واسترجاعها. وفي بحثهم البذري»يتناول برنرز-لي» وهندلرء ولاسيلا 
Berners-Lee, Hendler, and Lassila (2001)‏ خصائص الخطط التخصصية 
ontologies‏ بو ‘gave‏ 

يجموعات من العبارات المصاغة dab‏ كإطار وصف 
المصادر RDF‏ على سبيل المثال» تحدد معالم العلاقات بين المفاهيم» 
وتحدد القواعد المنطقية لتبريرها؛ إذ يصبح بإمكان الحاسبات 
”فهم“ معنى البيانات الدلالية على صفحة العنكبوتية؛ بتتبع 
الروابط التي تفضي إلى معلومات بعينها. )38 (P.‏ 

ويمكن للخطط التخصصية أن تتخذ أشكالا مختلفة. وقد أحصى أوشولد 
Uschold (1996)‏ الأشكال الأربعة التالية» التي تتراوح ما بين المتحللة من 
الرسميات إلى حد بعيد» والرسمية على نحو صارم» وذلك من منظور هندسة المعرفة. 
ويتم التعبير عن الخطط المتحللة من الرسميات إلى حد بعيد بطريقة غير منضبطة 
loosely‏ باللغة الطبيعية. ويأتى بعد ذلك على الطيف» الخطط التخصصية غير 
الرسمية المنتظمة» التي تستعمل لغة طبيعية حدودة ومنتظمة» لزيادة الوضوح والحد 
من الغموض. ويسمى الشكل الثالث المعارف شبه الرسمية 5610110110281 
ontology‏ ويتم التعبير عنها بلغة اصطناعية محددة شكلا. أما الشكل الأخير في هذا 
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الطيف فهو المعارف الرسمية على نحو صارم» التي يمكن أن تحدد بشكل شديد الدقة 
في التفاصيلء معالم ال صطلحات بعلم الدلالة الرسمي والنظريات الحزتية 
theorems‏ وعلى الرغم من OLE‏ الوصف المعترف به لشكل التصنيف التخصصي 
على ضوء العنكبوتية الدلالية» فإن الشكل المرشح ربا يكون النوع الرسمي على نحو 
صارم الذي رسم alles‏ أوشولد )1996( -Oschold‏ 

وتشمل العلاقات بين المفاهيم في الخطط التخصصية:؛ الترادف والتضاد. 
والكلمات أو العبارات التي يدخل مجالما الدلالي ضمن المجال الدلالي لأخرى 
hyponomy‏ (علاقة الكينونة 15-27 ) والتقسيم الهرمي الذي يعالج علاقة الجزء* 
بالكل Wes .meronomy‏ ما يتم التعبير عن تلك العلاقات بالأشكال البيانية لإطار 
وصف المصادر RDF‏ لإنشاء العنكبوتية الدلالية )2003 .(Gilchrist,‏ يضاف إلى 
ذلك أن الخطط التخصصية ينبغي أن تحدد القواعد المنطقية للتبرير» حول المفاهيم 
والعلاقات الداخلة k‏ بينهاء نظرا لأا على عكس اللغات المقيدة التقليدية (كالمكانز 
مثلا) ليست ثابتة؛ إذ ينبغي أن يتوافر ها التقنية التي تدل على التغيرات» وتنجز 
التجديدات آليا. ويمكن للخطط التخصصية بالارتباط بالمكونات الأخرى 
للعنكبوتية الدلالية» أن تجعل الحاسبات تستوعب الدلالات التي تنطوي عليها 
مصادر العنكبوتية. 

وفضلا عن ذلك» فإن وظيفية الخطط التخصصية» من الواضح أنها ليست هي 
نفسها وظيفية اللغات المقيدة التقليدية (كالمكانز وخطط التصنيف مثلا)؛ فالأولى 
يقصد بها في المقام الآول» نقل الدلالات من مصادر العنكبوتية إلى الحاسبات لا 
ضبط استعمال المصطلحات في تنظيم المعلومات واسترجاعها. ونورد في ۳/٠١‏ المزيد 
من مناقشات الخطط التخصصية:؛ ذلك القسم المكرس للعنكبوتية الدلالية. 
وغالبا ما ينظر إلى ورد نت Word Net (wordnet.princeton.edu)‏ بوصفها مثالا 
للخطط التخصصية. 
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واللغة اللازمة لتنظيم المعلومات واسترجاعها في العصر الرقمي» ناشئة 
بالتأكيد» ويتم إجراء البحوث بكثافة DLL‏ قضية اللغة في المجال. وتحويل اللغات 
«vocabulary switching‏ أحد تقنيات التحول آليا من إحدى old‏ تنظيم 
المعلومات واسترجاعها إلى أخرى. عير مختلف المجالات الموضوعية» من بين VLE‏ 
البحث والاستكشاف» كخطة واعدة لحسم الجدل حول اللغة الطبيعية في مقابل اللغة 
المقيدة. وبمجرد أن يتم تنفيذ هذه الخطة» سوف يقع الاختيار دون تردد على استعمال 
لغة لتنظيم المعلومات واسترجاعهاء دون الاقتصار على اختيار حدد سلفاء ولن يقتصر 
الأمر على اللغة في جال موضوعي بعينه؛ إذ يمكن للمستفيدين كسر استرقاق.أو 
استعباد تخصصاتهم القريبة» والإفادة من المعلومات العلمية بأسرها فعلاء في البحث 
.(Schatz, 1997)‏ ويختلف تحويل اللغات عن ”اللغة المقيدة غير المرئية من ناحيتين؛ 
أولاهما أن تخويل اللغات يعتمد بكثافة على البحث في معالجة اللغة الطبيعية» 
والأخرى أن تحويل اللغات يتعامل مع OLS‏ تنظيم المعلومات واسترجاعها في 
محالات عدة (أكثر من اثنين بكثير) بين اللغة المقيدة غير المرئية تتعامل في الأساس مع 
الترجمة بين اللغة الطبيعية وإحدى اللغات المقيدة المختزنة على الخط المباشر. فقد أنشأ 
تشن وشاتز Chen, Schatz‏ وزملاؤهماء على سبيل المثال» فضاءات مفاهيم concept‏ 
65 لعشرة ملايين من مستخلصات المقالات» موزعة على ألف Sle‏ موضوعي» 
تغطي العلوم والتقنية بأسرها )1997 (Schatz,‏ وفضلا عن ذلك تبين أن فضاءات 
المماهيم فعالة بالنسبة للاقتراح التفاعلي للمصطلحات» وتحويل اللغات 
.(Chen, et al., 1997)‏ 

وقصارى القولء فإن التنظيم والاسترجاع الآليين» بدلالات قابلة للامتداد 
والتوسع LA Ol pty «scalable‏ المستقبل» مادامت قضية اللغة في العصر الرقمي» هي 
الشغل الشاغل. ويمكن لتتابع الأحداث أن يصبح حقيقة إذا ما تطورت العنكبوتية 
الدلالية التي تصورها برنرز-لي Berners-Lee‏ وزملاؤه. 
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الفصل الخامس 
تقنيات الاسترجاع وصياغة الاستفسارات 


الآن» وقد ناقشنا قضية اللغة في تنظيم المعلومات واسترجاعها في الفصل 
الرابع» آن الأوان للانتقال إلى الموضوع التالي» وهو تقنيات الاسترجاع التي ينبغي 
وضعها في الحسبان» عند إجراء عمليات البحث. ونتناول بعد ذلك بالشرح. التعبير 
عن الاستفسارات أو صياغة الاستفسارات. 


تقنيات الاسترجاع: 

يقصد بتقنيات الاسترجاع مساعدة المستفيدين في العثور على ما مجتاجون إليه من 
معلومات» بفاعلية وكفاءة. وتتوافر للمستفيدين تقنيات متعددة» نتيجة لتطور تقنيات 
المعلومات» وتقدم البحث العلمي في تقنيات اللاسترجاع. وهناك مجموعة من تقنيات 
الاسترجاع تسمى بالطرق الأساس» بينم تسمى التقنيات الأخرى الطرق المتقدمة. 
تقنيات الاسترجاع الأساس: 

تقنيات ple io Vl‏ كالبحث البوليني Boolean searching‏ ومراعاة الحرف 
الأو J‏ من الكلمة Case sensitivity‏ والبتر Truncation‏ والبحث بالتقارب 
Proximity searching‏ والبحث بالحقل Field search‏ تقنيات أساس؛ نظرا 
لأنها تحظى بوجه عام بالدعم من جانب معظم نظم استرجاع المعلومات. ونتناول في 
الأقسام التالية وظيفة ومقومات هذه التقنيات الأساس كلا على حدة. 
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البحث البوليني: 

كما أشرنا بإيجاز في »١/7/1١ /١‏ سمي البحث البوليني باسم عالم الرياضيات 
الإنجليزي George Boole Jags‏ الذي أجرى تحليلات رياضية للمنطق. إذ 
استعمل بول ثلاثة معاملات» هی ”و “AND‏ و ”أو “Or‏ و ”في عدا “NOT‏ 
لتلخيص العمليات المنطقية للعقل البشري» وهي جمع )5 (AND‏ مفاهيم مختلفة 
لتكوين مفاهيم أكثر hades‏ وفصل (في) عدا (NOT‏ المفاهيم المركبة في مفاهيم مفردة 
أكثر بساطة )1993 (Smith,‏ وتضمين (أو (OR‏ المزيد من المفاهيم لتوسعة دلالتها. 
وتعرف كل هذه العمليات المنطقية أيضاً بالجبر البوليني. وعندما يستخدم pA‏ 
البوليني في استرجاع المعلومات» تنهض المعاملات الثلاثة المساة بالمعاملات البولينية» 
بالوظائف التالية: 

© المعامل "AND"‏ للحد من اتساع عملية البحث. 

« المعامل أو" 0" لتوسعة عملية البحث. 

« المعامل في] عدا "NOT"‏ لاستبعاد النتائج غير المرغوب فيها. 


ويجمع المعامل ”و “AND‏ بين مصطلحين أو أكثر» في استراتيجية البحث». 
ويشترط وجود جميع المصطلحات في الوثائق التي يتم العثور عليها. ففي استراتيجية 
«tol‏ التصفية والجدال Filtering AND Controversy‏ على سبيل المثال» ينبغي 
الحصول فقط على النتائج حول التصفية بوصفها جدالاً. ولا يمكن لأي نتائج حول 
التصفية بوجه عام» أو أي مجادلات أخرى» كالتحكم في السلاح» أن تلبي شروط 
البحث. ويفيد المعامل "AND",‏ على وجه الخصوص في البحث عن معلومات 
حول مفاهيم مركبة. 
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أما المعامل ”أو “OR‏ فيوسع عملية البحث بإدخال المزيد من المصطلحات في 
ER EE pal‏ وغالباً ما تكون المصطلحات التي يتم الربط بينها معا بأو OR‏ 
مترادفات أو مصطلحات متصلة. وينظر إلى الوثائق التي يرد بها أي من هذه 
المصطلحات بوصفها تسديدات Hits‏ ملائمة أو نتائج متوقعة. فمن الممكن على 
سبيل المثال لاستراتيجية بحث مكونة من ”التصفية أو الجدال“ أن تسفر عن نتائج 
حول جميع أنواع التصفية وجميع أنواع المجادلات» بالإضافة إلى الوثائق حول التصفية 
بوصفها Vide‏ ومن الواضح أن المعامل ”أو “OR‏ هيدف إلى توسعة مجال عملية 
البحثء ويزيد من ناتج الاسترجاع. 

أما المعامل '”فيهما عدا “NOT‏ فأكثر تقيبدا بالمقارنة بكل من ”و“ و 
“أو {gai‏ عدا“ يقيد Jle‏ عملية البحث» باستبعاد المصطلح أو المصطلحات 9 
ترد بعد المعامل ”فيا عدا“ ؛ فمن الممكن» على سبيل المثال» لاستفسار البحث 
”التصفية (ed‏ عدا الجدال“ أن يسترجع معلومات حول جميع أنواع التصفية (كتنقية 

الماء وتنقية المواء على سبيل (Stl‏ مادامت ليست جدالا. ومن الممكن استعال 

معامل ”في) عدا ‘NOT‏ 'عمداً لاستبعاد النتائج غير المرغوب فيهاء عند صياغة 
استفسان GaN‏ 

وعندما يتم استعمال نوع واحد فقط من المعاملات البولينية في استراتيجية 
بحث ماء تسمى العملية بالبحث البولينى البسيط. وعندما تشتمل استراتيجية البحث 
الواحدة على AST‏ من نوع واحد من المعاملات البولينية» تسمى العملية بالبحث 
البوليني المركب. والترتيب الطبيعي بالنسبة لمعالجة المعاملات البولينية» في معظم نظم 
استرجاع المعلومات هو: 

NOT عدا‎ (ed معامل‎ Safe 

« ثانيء معامل „AND;‏ 


LOR معامل أو‎ te. 
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ففي استراتيجية البحث البوليني المركب ”التصفية أو الرقابة وا جدال فيا عدا 
المكتبات“ على سبيل المثال» يمكن لمعامل (ed‏ عدا (أي الجدال فيا عدا المكتبات) أن 
يعالج yl‏ لاستبعاد أي وثائق حول الجدال المتعلق با مكتبات» ثم يجمع المعامل 
AND5‏ المصطلحين ”الرقابة“ و”الحدال“ مع مفهوم ”المكتبة“ الذي استبعد فعلاً. 
وأخيراً يتم ربط مصطلح ”التصفية“ بعلاقة "OR" sf‏ بمجموعة الوثائق التي 
أسفرت عنها عمليتا البحث السابقتان. ومالم تكن نتائج عملية البحث تلبي توقعات 
المستفيد النهائي» فإنه يمكن استعمال الأقواس لتغيير الترتيب الطبيعي للمعالجنة» أو 
تحديد الترتيب المقصود للمعالجة. ففي استراتيجية البحث السابقة» على سبيل SLE‏ 
يمكن للمستفيد النهائي أن يستخدم الأقواس على هذا النحو: (التصفية أو الرقابة) 
و(الجدال) في) عدا المكتبات. ومن ثم فإن ترتيب المعالجة بالنسبة هذه الاستراتيجية» 
يمكن أن يكون AND"" g5 "OR" sl‏ ثم في) عدا ALLL SY NOT"‏ يمكن أن 
تتبع القاعدة التي تقضي بأن تتم معالجة الأقواس الداخلية أكثر من غيرها 
Noi innermost‏ تليها الأقواس الخارجية» وهكذا. ومن شأن الوثائق التي يتم 
استرجاعها أن تكون حول ”التصفية“ أو ”الرقابة“ بوصفها OMe”‏ ولكنها لا 
تتصل ”بالمکتبات. وکا هو مبين» فإنه يمكن استعمال ثنائيات متعددة من الأقواس 
لتحديد ترتيب بعينه للمعالجة» في استراتيجية البحث البوليني المركب. ولهذا السبب 
أحياناً ما يسمى البحث البوليني المركب بالبوليني المسيج „nested‏ 

وكأسلوب للاسترجاع» فإن البحث البوليني هو الأسلوب الذي يستعمل إلى 
حد بعيد» في الغالب الأعم؛ من جانب جميع نظم الاسترجاع القائمة. إلا أن الأمر 
يتطلب قدراً من الوقت والمارسة للتمكن من أساليب البحث البوليني» وخصوصاً 
أسلوب البحث البوليني المركب. 
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البحث بمراعاة الحرف الأول من الكلمة: 

بالنسبة للغات كالإنجليزية والفرنسية والإسبانية» التي تحدث فيها الأحرف 
الكبيرة والأحرف الصغيرة في بداية الكلمات نوعاً من الاختلاف» يكفل البحث 
بمراعاة الحرف الأول من الكلمة Case-sensitive‏ للمستفيد النهائي القدرة على أن 
يعين على وجه التحديدء كيف يتم تمثيل المصطلح في الاستفسار والنظام؛ فالكلمتان 
target » Target‏ على سبيل المثال» تدلان على أمرين مختلفين. فالأولى التي تبدأ 
بحرف كبير» تدل على متجز للبيع بالتجزئة في الولايات المتحدة» ley‏ الثانية التي تبداً 
بحرف صغير» ببساطة مصطلح عام يعني الحدف أو الغاية وما شابه ذلك. وبمجرد أن 
يتم التمييز بين الشكلين» يمكن للمستفيد أن يقرر ما إذا كانت هناك حاجة للبحث 
بمراعاة الحرف الأول. فإذا كان المرء ينوي البحث عن معلومات حول متجر 
تارجت» op‏ كلمة Target‏ التي تبدأ بالحرف الكبير ينبغي أن يقع عليها الاختيار 
كمصطاح للبحث. ومالم يكن الأمر كذلك فإنه يمكن استعمال الكلمة target‏ التي 
تبدأ بحرف صغير. 

ويطبق البحث بمراعاة الحرف الأول من الكلمة على نطاق ضيق جداًء بالمقارنة 
بالبحث البوليني. إلا أن البحث بمراعاة الحرف الأول من الكلمة ينجز أنواعاً معينة 
من مهام الاسترجاع» لا تستطيع تقنيات الاسترجاع الأخرى إنجازها. 


البتر: 

البتر الذي يعرف أحيانا بالبدل وتغيير الشكل 099114850 والرد إلى الجذع 
stemming‏ والتجريد stripping‏ وإخفاء معالم المصطلحات «term masking‏ 
وخوارزمية الخلط conflation algorithm‏ تقنية لاستر جاع الأشكال المختلفة 
للمصطلحات. التي يجمعها معأ جزء معين. وعادة ما تحدد نظم استرجاع المعلومات 
رمزاً بعينه (كعلامة الاستفهام؟ أو النجمة # على سبيل المثال) لأغراض الدلالة على 
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البتر. فاستعال المصطلح المبتور (*) network‏ على سبيل المثال» كاستفسار يسترجع 
الوثائق حول networks‏ والوثائق حول networking‏ 


ويسمى بتر عجز أو كاسعة suffix‏ المصطلح» كا سبق أن أشرناء يبتر CS‏ 
الأيمن» الذي يتكفل بمعظم عمليات البتر. كذلك يمكن للبتر أن يتم أيضاً باستبعاد 
صدر الكلمة prefix‏ أو حشوها infix‏ (أى بعض الأحرف التي ترد في متتصف 
المصطلح). ويسمى حذف الصدر ببتر الجانب الأيسرء بينا يسمى حذف حشو 
المصطلح بالبتر الأوسط أو الداخلي. وقلما نجد بتر الجانب الأيسر» كا أنه لا يدعمة 
الآن سوى قليل من نظم استرجاع المعلومات. ومن الممكن استعمال البتر الأوسط 
hal‏ المصطلحات التي fat‏ أن تكتب بأكثر من هجاء واحد. فمن الممكن» على 
سبيل المثال لمصطلح الاستفسار المبتور Col*r‏ أن يسترجع كلا من -colour s color‏ 
وكذلك JI‏ أيضاً يمكن للبحث ely‏ على organi*aton‏ أن يسثر جع معلومات عن 


-organisation, organization كل من‎ 


ومن المهم بتر القطاع الصحيح من المصطلح. إذا ما كان المرء ينوي استععال 
أسلوب الاسترجاع هذا. ومن الممكن أن يؤدي البتر المبالغ فيه (كبتر cotalog‏ إلى 
cat‏ على سبيل المثال) أن يؤدي إلى استرجاع قدر كبير من المعلومات غير المرغوب 
فيهاء ومن ناحية أخرى يمكن للبتر KERESI‏ (كبتر catalogue‏ إلى catalogu‏ 
على سبيل المثال) ألا Gal Gat‏ من البتر. ولتوفير قدر من التحكم في البتر» يكفل 
كثير من نظم استرجاع المعلومات للمستفيد أيضاًء تحديد العدد الدقيق للأحرف التي 
يتم بترها". 
(*) يتصل كل ما ورد عن البتر هنا باللغات الي تكتب من اليسار إلى اليمين. ويتصل البقر ببنية 
الكلمة أو الصرف Morphology‏ وتختلف قواعد الصرف من لغة إلى أخرى؛ إذ تختلف اللغات 
الهندية الأوروبية الغروية أو اللصقية كالإنحليزية مثلاء عن اللغات السامية الاشتقاقية ومن بينها 
العربية. (por Ally‏ 
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البحث بالتقارب: 

lee‏ يمكن للمعامل AND)‏ أن يبين أي المصطلحات ينبغي أن ترد في نتائج 
البحث. فإنه لا يمكن أن يحدد مدى تباعد مواقع مصطلحات البحث هذه في الوثيقة. 
ففي صيغة البحث البولينية filtering AND controversy‏ على سبيل المثال» يمكن 
للمصطلحين filtering‏ و controversy‏ أن يردا متجاورين» أو يفصل بينه)| عدة 
مئات من الكلات» أو في أي مكان من الوثيقة المستهدفة. ويكفل البحث بالتقارب 
«proximity searching‏ الذي يعرف ا بالبحث بالتجاور adjacency‏ 
searching‏ للمستفيد القدرة على أن يحدد بدقة مدى التقارب» أو المسافة الفاصلة 
بين مصطلحي toed!‏ ومواقعه) النسبية» باستعمال معاملي (مع (WITH‏ (وقريب 
(NEAR‏ ويمكن لرموز البحث بالتقارب أن تختلف من نظام إلى آخر. 

ويعني معامل (مع (WITH‏ أن المصطلحين ينبغي أن يردا في النظام متجاورين؛ 
وبالترتيب نفسه الذي يرد في استفسار البحث. فصيغة البحث "المعلومات مع 
التقنيات" information WITH technology‏ على سبيل المثال» Jas‏ على أن 
الوثائق التي يسترجعها الاستفسار ينبغي أن تشتمل علي "تقنيات المعلومات" 
information technology‏ كعبارة“» ولیس أي شيء آخر (كالمعلومات والتقنيات 
«information and technology‏ أو ”معلومات التقنيات“ technology‏ 
9 على سبيل (SLM‏ يضاف إلى ذلك» أنه يمكن لتوسعة معامل 
nWITH WITH‏ أن تشترط أن يكون المصطلحان المرتبطان بالمعامل في حندود س 
2...n) n‏ و1 (n=‏ من الكلات فيا legis‏ وبالترتيبٍ المحدد. فمن الممكن على سبيل 
المثال لصيغة البحث information 2 WITH technology‏ أن تسترجع وثائق 


(*) مضاف ومضاف إليه هناء ويمكن للعبارة أن تكون موصوفا وصفة. (المترحم) 


1/1 


حول ”المعلومات information and technology “obsady‏ و" المعلومات 
وتقنيات الشبكات information and network technology“‏ وما شابه ذلك. 


ويعمل المعامل (قريب (NEAR‏ بطريقة مماثلة.ء أي أن المصطلحين اللذين 
يربط bee:‏ ينبغي أن يكونا متجاورين. إلا أنه على عكس المعامل (مع (WITH‏ فإن 
المصطلحين المرتبطين بالمعامل قريب يمكن أن يردا بأي ترتيب ماداما متجاورين. 
فصيغة البحث ”المعلومات قريب من information NEAR “oleih‏ 
technology‏ على سبيل JULI‏ يمكن أن تسفر عن نتائج حول تقنيات المعلوماث“ 
information technology‏ أو ”معلومiت technology “olsi‏ 
information‏ ويشترط المعامل nNEAR‏ أن يكون المصطلحان المرتبطان بالمعامل 
في حدود س م ''....12-م) من الكليات من PTY‏ البعض» ولكن بأي ترتيب 
كان. ومن ثم فإن الوثائق التي تشتمل على عينة العبارات التاليةء جميعها نتائج ملائمة 
لصيغة البحث ‘information 2 NEAR technology‏ 

.information and technology المعلومات والتقنيات‎ 

.information and network technology المعلومات وتقنيات الشبكات‎ 

.technology and information التقنيات والمعلومات‎ 


.technology and business information التقنيات والمعلومات الإدارية‎ 


والبحث بالعبارات «phrase searching‏ في مقابل البحث بالكليات word‏ 
searching‏ ليس سوى أحد تطبيقات البحث بالتقاربء إذا كانت المعلومات 
الأصلية التي تم تجميعها لنظم استرجاع المعلومات» قد تم تمثيلها بالكلمات فقط (أي 
تكشيف الكلمات). ولكي نكون أكثر تحديداًء فإن المعامل WITH‏ يمكن أن ينجز 
البحث بالعبارات على وجه التحديد» بين| تدعم بقية معاملات التقارب عمليات 
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البحث اعتماداً على تجاورات juxtapositions‏ مختلفة للمصطلحات الواردة في صيغة 
البحث. كذلك يمكن للتجاورات أن تمتد خارج مدى س من IAS‏ ولكن في 
حدود الحقل نفسه أو الفقرة نفسهاء في بعض نظم استرجاع المعلومات. فنظام ديالوج 
DIALOG‏ على سبيل المثال» وهو نظام لاسترجاع المعلومات على الخط المباشرء 
يكفل للمستفيد القدرة على أن يشترط ضرورة ورود مصطلحات البحث في حدود 
الحقل نفسه (كحقل العنوان أو حقل المستخلص على سبيل المثال) أو الفقرة نفسها. 
البحث بالحقل: 

عادة ما يتم تنظيم معلومات الوثائق بخواص مميزة كالمؤلف» والعنوان وتاريخ 
النشر ونوع الوثيقة. وتسمى هذه الخواص المميزة بالحقول» بمجرد أن يتم التعبير عنها 
في نظم استرجاع المعلومات”. وعندما يتم تنظيم المعلومات أو الوثائق بالحقلء فإنه 
يمكن استرجاعها [eb‏ بعد بالطريقة نفسها. ويقصر البحث بالحقل» بطبيعته عمليات 
البحث على حقل واحد أو عدة حقولء بدلا من الوثيقة بأكملها. 

وينهض البححث بالحقل بوظيفتين؛ أولاهما تحديد نقطة البدء بالنسبة 
للمعلومات التي يبحث المرء عنهاء إذا كانت الخاصة المميزة للحقل (كاسم المؤلف 
مثلاً) معروفة؛ فإذا كنا نرغب على سبيل المثال في الحصول على معلومات حول أعمال 
ph‏ بيئر لون Hans Peter Luhn‏ المتصلة باسترجاع المعلومات» فإنتا نببحث 
بالمصطلح "استرجاع المعلومات information retrieval‏ إلا LÍ‏ سرعان ما يتبين 
لنا أن مثل ذلك البحث يمكن أن يسترجع» ولا شك معلومات أكثر بكثير OLS Le‏ 
متوقعاًء نظراً لأن جميع الأعمال حول استرجاع المعلومات» بها في ذلك أعمال لون. 


)*( عادة ما يتم في نظم استرجاع المعلومات اعداد تسجيلة .لكل وثيقة يشملها النظام. ويقسم محتوى 
التسجيلة إلى حقول» يضم كل منها عنصرا من عناصر البيانات المميزة. (المترحم) 


173 


سوف يتم استرجاعها كنتائج لعملية البحث. وإذا ما أجرينا عملية بحث باسم 
al gl‏ أي البحث بحقل المؤلف. فإننا يمكن أن نكون قادرين على استرجاع كل ما 
ألف (لون) من وثائق حول استرجاع المعلومات فضلاً عن الموضوعات الأخرى. 
وحينئذ يمكننا استعمال المعامل و0١4‏ للجمع بين نتائج عملية البحث السابقة 
ومصطلح ”استرجاع المعلومات“ لاستبعاد أعمال (لون) في المجالات الأخرى 
خلاف استرجاع المعلومات. 

وبالإضافة إلى ما أوضحنا توأء يمكن للبحث بالحقل أن يضيق Lad‏ جال 
عملية البحث على نحو فعال؛ لنفترض أن عملية بحث عن استرجاع المعلومات قد 
أجريت في نظام مصمم لعلم المعلومات» فإن الناتج يمكن أن يشتمل على عدة آلاف 
من التسجيلات. وقليل من المستفيدين من يمكن أن تكون لديه الرغبة في الاطلاع 
على نتائج عمليات بحث بهذه الضخامة. وعند هذه النقطة يمكن لحقول الخواص 
المميزة كتاريخ النشر See‏ أو اللغة» أو نوع الوثيقة» أن تساعد على نحو فعال في 
تضييق SE‏ عملية البحث. والبحث بالموضوع أو المفهوم (أي البحث ”بحيثيات أو 
موضوع “aboutnes‏ المعلومات» متبوعاً بالبحث بالحقل (أي البحث ”بخواص 
ofness‏ “ المعلومات)» من الطرق المألوفة لتنقية نتائج الاسترجاع. 


ومعظم المعلومات المتوافرة على الإنترنت» لا يتم تنظيمها بحقول الخواص 
المميزة في نظم استرجاع الإنترنت» نظراً للأسباب التي سبق أن تناولناها في الفصول 
السابقة. ولهذا فإن البحث بالحقل غير قابل للتطبيق بوجه عام على استرجاع 
المعلومات من الإنترنت. إلا أن تقنيات الاسترجاع الرئيسة الأخرى التي ناقشناها في 
هذا القسم» تحظى بالدعم الكلي أو الجزئي من جانب نظم استرجاع الإنترنت» وهذه 
قضية نستكشفها بمزيد من التفصيل في الفصل الثامن» “نظم استرجاع المعلومات . 
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أساليب الاسترجاع المتطورة: 

يتم تطبيق أساليب الاسترجاع الرئيسة التي سبق تناو ها في معظم- إن لم يكن 
في كل- نظم استرجاع المعلومات. وفي مقابل ذلك تتوافر أساليب الاسترجاع المتقدمة 
أو المتطورة ٤ Asasi advanced‏ قطاع صغير من نظم استرجاع المعلومات القائمة» 
وذلك بعد اختبارها في ختبرات البحث العلمى. 


البحث المشوش: 

يبدو البحث المشوش fuzzy‏ متصلاً بالبتر» ولكن مع اختلاف جوهري؛ فبين 
يقصد بالبتر استرجاع مختلف أشكال المصطلح» عندما تتقاسم فيا بينها بعض الأجزاء 
المشتركة» فإن البحث المشوش يقصد به العثور على المصطلحات التي حدثت أخطاء 
في هجائها عند إدخال البيانات أو إدخال الاستفسار. فمن الممكن ل صطلح 
computer‏ على سبيل JL‏ أن Lis sud‏ في هجائه ليصبح compter‏ أو 
ccomptuer‏ أو .compyter‏ ومن الممكن للتعرف على الأحر optical L5 4G‏ 
character recognition (OCR)‏ والنصوص المضغوطة» أن يسفرا أيضاً عن 
محتوى مشحون بالأخطاء. وعلى ذلك فإن البحث المشوش مصمم على وجه 
| لخصوص» لاكتشاف وتصحيح أخطاء الهجاء أو الأخطاء التي تنشأ عن التعرف على 
الأحرف ضوئياًء أو ضغط التصوص )1998 (Grassman & Frieder,‏ 

وس - جرام N-gram‏ أسلوب خاص لتطبيق تقنية البحث المشوش. و س - 
جرام سلاسل متتابعة ثابتة الطول من س (س = ٠۲‏ 7.....س) (لل.... ,3 (M=2,‏ من 
أحرف المصطلح )1997 (Kowalski,‏ أو مصطلح مفكك إلى أجزاء من AAS‏ 
بحجم س. وإذا ما اتخذنا مصطلح fuzzy searching‏ كمثالء فإنه يمكن أن 
يصبح oJ‏ 


175 


ثنائى الجرام 


e Bi- grams (n= 2): fu uz zz zy se ea ar ar rc ch hi in ng 


el 4 ٿلاڻي‎ 

e Tri-grams (n=3): fuz uzz zzy sea ear arc rch chi hin ing 

وهناك أيضاً أنواع أخرى من أعداد الجرامات n=grams‏ (مثل الجرامات 
الرباعية - quart grams‏ أو الجرامات الخياسية -penta-grams‏ وتصبح a‏ 
الأعداد من الجرامات س - جرامات» التي ليس من الضروري أن تمثل المعنى الدلالي 
للمصطلح» هي الوحدات الأساس للتحقق من الأخطاء المحتملة. وحينئذ تستخدم 
خوارزميات المضاهاة لتحديد ما إذا كانت هناك مضاهاة بين التمثيل والاستفسار 
(Grossman & Frieder, 1998)‏ وإذا كانت جميع أعداد الجرامات س- جرام 
بالنسبة لمصطلح ما تضاهي الاستفسارء ley‏ يكون هناك واحد أو اثنان لا يضاهيان» 
يتم اكتشاف الخطأء ويصبح بالإمكان تقديم الناتج الصحيح. وهناك أسلوب آخر 
مألوف لتطبيق البحث المشوشء وهو المقارنة المعجمية. وذلك بمقارنة كل كلمة في 
الاستفسار يتم إدخاها في نظام استرجاع المعلومات» مقابل معجم» ويتم حينئذ 
تصويب أي t=‏ يتم اكتشافه. 

وبعبارة أخرى» فإن البحث المشوش يمكن أن يتغاضى عن» أو يتسامح مع 
الأخطاء التي تقع أثناء إدخال البيانات أو إدخال الاستفسارات. ولا يمكن للوثائق 
التي تشتمل على أخطاء ناتجة عن الحجاء غير الصائب» أو أخطاء التعرف على الأحرف 
ضوئياء وما شابه ذلك من أسباب» أن تسترجع بدون تقنية البحث المشوش. 
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Coed!‏ الموزون: 
يحدث في بعض الأحيان؛ أن يرغب المستفيد في التركيز على كل مصطلح في 
الاستفسار على نحو متفاوت؛ ففي استفسار البحث ”التصفية والجدال“ filtering‏ 
AND controversy‏ على سبيل EL‏ يمكن أن يكون المستفيد مهتا أكثر بالجانب 
الخاص * “ULL”‏ لا بالجانب الخاص ”بالتصفية“ في حد ذاتها. وقد صمم البحث 

الموزون weighted‏ لهذا الغرض على وجه التحديد. 

ولأغراض البحث الموزون يتم تحديد أوزان للمصطلحات عند صياغة 
استفسار الببحث. للدلالة على أهميتها النسبية» أو مدى تركيز المستفيد عليها. ومن 
الممكن إعطاء الأوزان في شكل رموز (كرمز النجمة # في نظام إرك ERIC‏ الذي 
يدل على الواصفات الرئيسة» على سبيل المثال) أو رقمياً (عشرياً وأرقام صحيحة). 
ويتم تحديد مدى الوزن (كمدى الوزن من ١‏ إلى 5» على سبيل المشال» حيث ۵ هي 
أعلى نقطة) على نحو يختلف من نظام إلى آخر. ويشترط بالطبع لإجراء البحث 
الموزون أن يكون الوزن قد طبق في مرحلة التنظيم» وبشكل أكشر تحديداً في مرحلة 
التكشيف. فمن الممكن على سبيل المثال في تطبيق البحث الموزون على الاستفسار 
”التضفية Y‏ والجدال 1“ filtering 3 AND controversy‏ أن يتوقع المستفيد 
الحصول على الوثائق التي تم فيها تسجيل هذين المصطلحين باستعمال مقياس الوزن 
نفسه؛ أي تحديد الوزنين ۳ و٦‏ للمصطلحين ”التصفية“ و”الجدال“ على التوالي. 

ومن الممكن استعمال الغتبة threshold‏ وهي مفهوم مرتبط ارتباطاً وثيقاً 
بالبحث ghl‏ 6095 لتحديد متى تلبي نتائج عملية البحث شروط الاستفسار الموزون. 
فإذا افترضنا أن كانت العتبة بالنسبة لعملية البحث ”التصفية ۳ والحدال “٦‏ 


(*)مرصد بيانات متخصص ف التربية وما يتصل UG‏ (المترحم) 
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filtering 3 AND controversy 6‏ قد وضعت عند 4» حينئذ لا يمكن النظر لأي 
نتائج بعتبة أقل من 4 (كوثيقة في الموضوع نفسه ولكن بوزن ۳ بالنسبة ”للتصفية“ 
وه بالنسبة للجدال على سبيل (JEL‏ بوصفها صا حة في هذه الحالة. 

وما لا شك فيه أن إقرار الوزن ليتم تحديده للمصطلحات,» أمر حاسم في 
البحث الموزون. وهناك خوارزميات وزن مختلفة تستخدم فعلاً؛ وموقع المصطلح» 
وتقارب المصطلح» وتردد المصطلح (tf)‏ والتردد العكسي للوثيقة Cidf)‏ وتقدير 
الفرد» هي المعايير الأساس بالنسبة لتحديد الأوزان. إلا أن من بين تلك المعايير؛ 
وخصوصاً تقدير الفرد« أو الطريقة الحتمية أو القطعية (Davis, deterministic‏ 
)1997 ما يمكن تطبيقه عملياًء للبحث الموزون. نظراً OV‏ المستفيد حين قام بتحديد 
الأوزان لمصطلحات الاستفسارء لم يكن على دراية بالوثائق التي يمكن استرجاعها. 
إلا أن جميع المعايير الأخرى الخاصة بتحديد الأوزان» تتوقف على خواص 
المصطلحات المقتبسة أو المقتطفة من الوثائق الأصلية. ولمذاء فإن أساليب الوزن 
القائمة على موقع المصطلح. والمعايير الأخرى لا تبدو قابلة للتطبيق إلا على التكشيف 
الارن قط 

ويبدو البحث الموزون القائم على القرار الفردي» ذاتيا جدا. إلا أن تطبيقه 
يعتمد فعلاً أيضاً على الجمع بين عوامل كالحاجة إلى المعلومات» وطبيعة نظم استرجاع 
المعلومات» وأنواع النتائج المتوقعة. وبعبارة أخرىء فإن المستفيد هو من يقرر الأوزان 
بالنسبة لمصطلحات الاستفسار» واضعا تلك العوامل المحددة في ltt‏ ولهذا فإن 
تخصيص الأوزان في أثناء صياغة الاستفسار» ليس مرد مهمة تعسفية. 

وكما سبق أن by‏ فإن هناك معايير لتحديد الأوزان» يمكن الاختيار من بينهاء 
من أجل التكشيف الموزونء أكثر ما هو متاح بالنسبة للبحث الموزون. ومن بين تلك 
المعايير» دلالة موقع المصطلح على مكان ورود المصطلح في الوثيقة. وكقاعدة لا محيد 
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عنهاء فإن المصطلح الذي يرد في أماكن كالعنوان» أو عناوين الأقسام» والجمل 
الموضوعية ctopic sentences‏ يمكن أن يحظى بوزن أعلى من تلك المصطلحات التي 
ترد في أقسام أخرى من الوثيقة. ويعني تقارب المصطلحات تلك المسافة الفاصلة بين 
مصطليحات G EASE‏ الوثيقة: ويمكق ple de gd gill‏ أنه كلا عتاقك LM‏ 
أو كلما ازداد التقارب بين المصطلحات موضوع النظرء ارتفع وزن BASH‏ الذي 
يمكن أن تحظى به المصطلحات. ومن ناحية أخرىء فإن تردد المصطلح (ت م (tf‏ 
يُعرّف بوصفه عدد المرات التي يرد بها المصطلح في وثيقة ما. وكا أوضحنا من قبل» 
Of‏ المصطلحات عالية التردد (bi‏ ليست بالضرورة مصطلحات تكشيف مرشحة 
جيدةء لأنها يمكن أن تكون كلمات وظيفية أو نحوية» أو كلمات لا تحمل معنى مهما 
في الاسترجاع. dy‏ مقابل ذلك» فإن أفضل مصطلحات كشفية» أو تلك المصطلحات 
التي يمكن أن تحظى بأوزان عاليةء هي تلك التي ترد بكثافة في وثائق بعينهاء ونادراً ما 
ترد في بقية وثائق مرصد البيانات )1989 (Galton,‏ ومن ثم فإن عدد الوثائق التي 
يخصص ها مصطلح معين» ينبغي أن يوضع فى الحسبان عند إقرار الأوزان. ويعرف 
هذا الأسلوب بالتردد العكسي للوثائق invesse document frequency (idf)‏ 
نظراً لأن الأوزان التي يتم تحديدها تتناسب عكسيا مع تردد الوثائق. ويعني ذلك على 
وجه التحديد, أنه كلما قلت الوثائق التي خصص أو يعين ها المصطلح, ارتفع الوزن 
الذي تحظى به. 

ولما كان تردد المصطلحات WE‏ ما يستعمل مرتبطاً بالتردد العكسي للوثائق 
لتحديد الوزن الذي يمكن أن تحظى به المصطلحاتء فإن هذا الأسلوب يسمى 
أسلوب الوزن بناء على تردد المصطلحات. والتردد العكسي للوثائق. وطول الوثيقة 
(ط dls‏ أحياناً ما يوضع أيضاً في الحسبان» جنباً إلى جنب مع أسلوب الوزن. بناء 


179 


على تردد المصطلحات والتردد العكسي للوثائق» وذلك BLS Y‏ معيار آخمر في إقرار 
أوزان المصطلحات. وإذا ماظل كل من تردد المصطلح والتردد العكسي للوشائق 
ثابتين» فإنه كلما طالت الوثيقة التي تشتمل على المصظلح» ارتفع الوزن الذي يمكن أن 
يحظى به المصطلح. وقد اتبع أسلوب الوزن بناء على تردد المصطلحات والتردد 
العكسي للوثائق وطول الوثيقة» على نطاق egila‏ في مشروع مؤتمرات استرجاع 
النصوص (تر 3 (Spirck Jones, 2000) Text REtrieval (TREC‏ 
Conference‏ ونقدم مناقشة تفصيلية لسلسلة ترك TREC‏ في الفصل الحادي عش. 

وتستخدم أساليب وزن أخرىء كأساليب الاحتالات» في التطبيقات العملية 
Last‏ وفضلاً عن ذلك» فإن أساليب الوزن هذه» غالباً ما تطبق في تجمغات مختلفة مع 
طرق أخرى؛ فمن الممكن على سبيل المثال. تطبيق أسلوب موقع المصطلح جنباً إلى 
جنب مع تقارب المصطلحات في إحدى خوارزميات الوزن. ويمهد البحث الموزون 
ple‏ للاسترجاع الفعال للمعلومات. 
توسعة الاستفسارات: 

حتى وإن حظيت صياغة الاستفسار بالتفكير العميق» وهذا موضوع نستكشفه 
بمزيد من التفصيل في القسم 0/ 2 فإنه لا يمكن للمستفيد أن يضمن عدم حاجة 
استفسار البحث إلى المراجعة أو التوسعة» بمجرد الانتهاء من صياغته. وتوسعة 
الاستفسارات أسلوب للاسترجاع» يكفل للمستفيد النهائي فرصة الارتفاع بمستوى 
الأداء» بمراجعة استفسارات البحث بناء على النتائج التي تسترجع فعلاً. وعمليات 
البحث اعتمادا على توسعة الاستفسار تكرارية وتفاعلية» كما يتضح في الشكل 
رقم .\/o‏ 
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الشكل رقم ٥‏ عملية توسعة الاستفسارات 


ويتم فحص النتائج التي يتم الحصول عليها من عمليات البحث» بعد تقديم 
كل استفسارء لتبين ما إذا كان من الممكن التقاط أي معلومات من هذه النتائج» 
وتضمينها في صياغة جديدة للاستفسار. ومن الممكن نظريا تكرار عملية توسعة 
الاستفسارات إلى أن يتم الحصول على نتائج مرضية. ويمكن للتفاعل بين نظام 
استرجاع المعلومات والمستفيد» أثناء عملية توسعة الاستفسارات» أن يساعد على 
الارتفاع بمستوى أداء الاسترجاع. 

وكا ذهب رسنك وفوهان )2006( Resnick and Vaughan,‏ فإن توسعة 
الاستفسارات إحدى الطرق التي تتبع عموماً في السياق. والأسلوب الآخر هو 
تقليص, أو انكاش الاستفسارات. وتنطوي توسعة الاستفسارات على إضافة 
مترادفات أو مصطلحات متصلة أخرى إلى الاستفسارات بمعامل ”أو“ لزيادة عدد 
حالات المضاهاة التي يتم تحديد معالمهاء ey‏ دف تقليص الاستفسارات إلى 
التخلص من غموض أي مصطلحات متعددة المعاني» منن أجل ضبان استرجاع 
حالات المضاهاة المناسبة دون سواها. ومن الممكن تقسيم توسعة:الاستفسارات إلى 
ثلاث فئات» ely‏ على المصادر التي يتم منها اختيار المصطلحات المتصلة من أجل 
التوسعة )1999 (Gauch, Wang, Rachakonda,‏ وع وجه التحديد,. فإن 
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التوسعة اعتماداً على مصطلحات منتقاة من مجموعة فرعية من الوثائق المسترجعة؛ sly‏ 
على استفسار بعينه» تسمى التوسعة ely‏ على استفسار معين .query-specific‏ وإذا ما 
تمت التوسعة بمصطلحات أمكن التحقق منها عن طريق تحليل محتويات مرصد بعينه 
للنصوص الكاملةء فإنها هنا توسعة ely‏ على رصيد معين .corpus-specific‏ وإذا ما 
تمت التوسعة بمصطلحات واردة في مكانز على الخط المباشر» لم يصمم خصيصا GY‏ 
de pat‏ بعينهاء leb‏ تسمى التو سعة elu‏ على لغة معينة language-specifiic‏ 

ومن الممكن تنفيذ توسعة الاستفسارات يدويا أو آليا. وبالنسبة للتوسعة 
اليدوية للاستفسارات» يقرر المستفيد كيف يمكن الإفادة من نتائج عملية البحث» ٠‏ 
لكي يعدل الاستفسار. وبالنسبة للتوسعة الآلية للاستفسار (التي تعرف أيضا بالتلقيم 
المرتد للصلاحية (relevance feedback‏ فإنه يفترض أن تكون الوثائق المتربعة على 
E A‏ ها وین کے eels‏ ف مراجعة glad‏ ولا 
يشارك المستفيد النهائي على نحو مباشر في عملية تعديل الاستفسار & (Grossman‏ 
Frieder, 1998; Salton, 1970)‏ وعند هذه النقطة يمكننا أن نلاحظ أن توسعة 
الاستفسارات» ليست بالتعبير بالغ الدقة للدلالة على هذه العملية» نظراً لأن 
الاستفسار لن يتسع بالضرورة» Eby‏ يتعرض للتعديل دائياً. ومن ثم فإن تعديل 
Sila I‏ يدو Sl lias‏ ما مة God‏ ذه الكتملية: 

وهناك أسلوب آخر لتعديل الاستفسارات» يحظى Lal‏ بالتأييد» ويتم تطبيقه 
فعلاً من جانب بعض نظم استرجاع المعلومات؛ ففي هذا الأسلوب ترد المصطلحات 
آليا في قائمة خيارات menu‏ منسدلة» كاقتراحات» ley‏ يقوم المستفيد بإدحال 
الاستفسار في صندوق البحث. وعلى الرغم من أن بعض المستفيدين قد يجدون هذا 
الأسلوب غير مشجع» يدعي آخرون (مثل 2006 (White & Marchionini,‏ أنه 
من الممكن لمثل هذا الأسلوب أن يدعم فعلاً التوسعة الفورية للاستفسارات. 
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وترتيب المخرجات طبقياًء الذي يتم في كثير من نظم استرجاع المعلومات» 
أسلوب مهم أساس بالنسبة للتلقيم المرتد للصلاحية؛ أو توسعة الاستفسارات LST‏ 
وعلى نحو ماثل لأساليب الوزن التي سبقت مناقشتهاء فإن خوارزميات الترتيب 
. الطبقي تستند» في أغلب الأحيان على معايير من قبيل موقع المصطلح» وتقارب 
الصطلح» وتردد المصطلح. وعادة ما يطبق كل نظام لاسترجاع المعلومات 
خوارزميات الترتيب الطبقي الخاصة ca‏ باختيار معايير معينة. ومشل خوارزميات 
الترتيب الطبقي هذه» لا تنشر أو تتاح على SUI‏ عادة. وهناك معيار ترتيب طبقي 
جديد» يسمى أسلوب الرابطة الراجعة backlink‏ أدخله عام ۱۹۹۸ جوجل 
Google‏ أحد نظم استرجاع معلومات الإنترنت. لترتيب نتائج البحث في 
العنكبوتية العالمية (Vidmar, 1999) Lab‏ ويحكم أسلوب الرابطة الراجعة على 
جودة صفحة العتكبوتية» بإحصاء عدد مواقع العنكبوتية الأخرى التي توفر روابط 
فائقة hyperlinks‏ ذه الصفحة»ء وذلك من بين أشياء أخرى. وهناك المزيد من 
مناقشات أسلوب الرابطة الراجعة» في الفصل الثامن ”نظم استرجاع المعلومات"". 

والاستفسار by example JAL‏ لإ#عتاقو أسلوب آخر لتوسعة 
الاستفسارات» حيث يدل مصطلح ”مثال“ على النتائج التي استرجعت Lab‏ 
وبعبارة OB as AT‏ النتائج التي يتم استرجاعهاء تعامل بوصفها أمثلة للمزيد من 
الاستفسارات. وفي نظم استرجاع الأصوات والصوره يمكن للمثال أن يأتي مباشرة 
من المستفيد» كالمخطط المرسوم باليد لزهرة؛ لا من المعلومات المقتطفة من نتائج عملية 
البحث. وعند البحث في الإنترنت» يمكن للمستفيد التعبير عن تلقيم الصلاحية 
المرتد» بالنقر ببساطة على الروابط الفائقة مثل ”المزيد مثل هذا أو المزيد من هذا القبيل 


. ‘More like this 
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وغالباً ما تدعو الحاجة إلى تعديل الاستفسارات في استرجاع المعلومات» لأنه 
يمكن لهذا التعديل أن يرتفع بمستوى أداء الاسترجاع» وذلك بمراجعة استفسار 
عملية البحث استناداً إلى المصطلحات المقترحة في صندوق عملية البحثء أو النتائج 
التي تم الحصول عليها فعلاً. وكأساليب للاسترجاع» فإن توسعة الاستفسارات 
وتلقيم الصلاحية المرتد على وجه o paih‏ يتمتعان بالتطبيق على نطاق واسع» 
فضلاً عن الاحتمالات المستقبلية العريضة في استرجاع المعلومات في العصر الرقمي. 
البحث في مراصد بيانات متعددة: 

يعني البحث في مراصد بيانات متعددة» الذي يعرف أيضاً بالبحث الموحد 
4 البحث تزامنيًا في أكثر من نظام واحد لاسترجاع المعلومات. وينظر إلى 
مصطلح مرصد البيانات هنا dole‏ بوصفه مرادفاً للنظام”. والحاجة إلى البحث في 
مراصد بيانات متعددة» ثلاثية الأبعاد؛ فمن الممكنء AY sf‏ البحث في نظام واحد 
لاسترجاع المعلومات» ألا يسفر عن ما يبحث عنه المستفيد» لأن لكل نظام لاسترجاع 
المعلومات حدود التغطية الخاصة به والتوجه والمقومات أو الخواص. وقي هذه IH‏ 
ينبغي اللجوء إلى نظم أخرى لاسترجاع المعلومات من أجل عملية البحث. Lb‏ 
يمكن للبحث في مراصد بيانات متعددة أن يكون بمثابة أداة اختيارء إذا م يكن 
المستفيد متيقناً من أي النظم يمكن أن يكون الخيار الأفضل بالنسبة لاستفسار بعينه. 
ثالثاء يمكن للنتائج التي يتم الحصول عليها من البحث في مراصد بيانات متعسددة 
أن توحي أيضاً أو تدل على النظم الملائمة للمستفيدء لإجراء المزيد من عمليات 
البحث فيها. 


) لاد مع المؤلفة في ذلك of‏ مرصد البيانات database‏ يمكن أن يكون أحد مكونات نظام 
ستر حا ع المعلومات. وبعبارة أخرى» OB‏ نظام الاسترجاع Y‏ يقتصر على مرصد البيانات. (a Y‏ 
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وعند البحث في مراصد بيانات متعددة» على المرء أن ينتبه» على وجه ا لخصوص 
لأوجه الاختلاف في syntax obs‏ الاستفسارات» واللغة» وإمكانات البحث التي 
يكفلها كل نظام؛ فمن الممكن لخاصية مألوفة وأساس في نظام ماء أن لا تحظى 
بالمساندة في نظم أخرى. وفضلاً عن ذلك» فإنه يمكن للخاصية نفسها التي تحظى 
بالدعم في كل النظمء ألا يتم التعبير عنها بالطريقة نفسها. فمن الممكن» على سبيل 
المثال» للمعامل البوليني 5 AND‏ أن يستخدم في نظام ماء بین يستخدم نظام آخر 
علامة زائد. كذلك يمكن للغات المستخدمة في النظم المتعددة أن تكون مختلفة أيضا. 
وتشمل الاحتمالات. اللغة الطبيعية في مقابل اللغة المقيدة» واللغات المقيدة المختلفة» 
واللغة الطبيعية المستعملة في OVE‏ تخصصية مختلفة. | 
وهناك تحد آخر يواجهه البحث في مراصد بيانات متعددة» وهو كيفية معاملة 
البيانات مختلفة الصيغ formats‏ (مثل آسكي ASCH‏ والفهرسة المقروءة آلياً [مارك 
(IMARC‏ المختزنة في مراصد بيانات متعددة. وزد 74.5٠‏ 239.50 مواصفة 
معيارية للتعريف بخدمة استرجاع المعلومات» وتحديد مواصفات البروتوكول 
Protocol Specification‏ بالنسبة لتطبيقات المكتبات» وضعت لعالحة البيانات 
بجميع الصيغ لأغراض الاسترجاع» وذلك من بين أشياء أخرى. ومن ثم فإن نظم 
استرجاع المعلومات الملتزمة بالمواصفة المعيارية زد 4.5٠‏ 7: يُمكن البحث فيها 
تزامنياً» بصرف النظر عن أوجه الاختلاف في الصيغ والتقارب الجغراني و (Michael‏ 
Hinnebusch, 1995)‏ &. ولا كانت قد أقرت من جانب المعهد الوطنى الأمريكى 
للمواصفات المعيارية (آنسى American National Standard (ANSI‏ 
Institute‏ والمنظمة الت all‏ اغات المعيارية للمعلومات (نيزو (NISO‏ 
National Information Standards Organization‏ فإن زد ۳۹.٥۰‏ تطبق 
على نطاق واسع في الفهارس المتاحة للجمهور على الخط SUM‏ اعتماداً على 
العنكبو تية العالمية 5 Web-based OPAC,‏ (وبباكس (WebPacs‏ وبعض الأنواع 
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الأخرى من نظم استرجاع المعلومات. واعتماداً على زد 74.0٠‏ يمكن للمستفيد أن 
يسترجع cal‏ المعلومات باستخدام واجهة تعامل interface‏ موحدة الشكل» Li‏ 
كانت واجهة التعامل التي توافرت للنظام في الأصل. 

وانطلاقاً من زد ۳۹.٠١‏ واستجابة للتوقعات التقنية Leal J‏ فإن خدمة 
العنكبوتية للبحث والاسترجاع «Search/ Retrieve Web Service (SRW)‏ 
والبحث والاسترجاع عن طريق المحدد الموحد لمكان المصدر Search/Retrieve‏ 
evia URL (SRU)‏ بروتوكولان قصد | تحديد معام شكل معياري لاستفسارات 
البحث في الإنترنت» وكذلك بنيان الاستجابات. فعندما يقدم المستفيدون الاستفسار 
نفسه لعدة نظم لاسترجاع المعلومات» فإن التظم syntax‏ الذي يعبر عن الاستفسار 
يمكن أن يكون Lie‏ وكذلك ال حال أيضا بالنسبة لبنيان الاستجابات؛ إذ تشتمل كل 
استجابة لا على نتائج عملية البحث فحسب» وإنم| على معلومات الصياغة أيضاً. 
ويعالج كل من خدمة العنكبوتية للبحث والاسترجاع SRW‏ والبحث والاسترجاع 
عن طريق المحدد ا موحد لكان المصدر SRU‏ اللذان يسميان إختصاراً SRW/U‏ 
هذه المشكلات» وذلك بتحديد مواصفات syntax oll‏ بالنسبة للاستفسارات 
والنتائج؛ فهذان الأسلوبان SRW/U‏ يكفلان» على وجه التحديد» للمستفيدين» 
ومتعهدي نظم استرجاع المعلومات» إمكانية توجيه الاستفسارات لمراصد بيانات 
الإنترنت» وإعادة النتائج المسترجعة بسلاسة؛ دون الحاجة إلى بروتوكولات ما وراء 
البحث metasearch protocols‏ المعقدة» كالمواصفة المعيارية زد ۳۹.٥۰‏ على سبيل 
(Morgan, 2004) Jil!‏ فبالمقارنة od,‏ الاخيرة» فإن SRW/U‏ أقل Oly das‏ 
كانت تقابل دلالياً المواصفة المعيارية زد ۳۹.٠١‏ الكلاسيكية )2003 (Levan,‏ 
وتعمل مكتبة الكونجرس غلى نشر SRW/U‏ وما يتصل به من مواصفات معيارية 
(Library of Congress, 2008)‏ 
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وفضلاً عا سبق ذكره من مشكلات وتحديات» ترتبط بالبحث في مراصد 
بيانات متعددة» فإن سبيل دمج النتائج المسترجعة من عدة.مراصد بيانات» يفرض 
تحدياً ST‏ فالمخرجات المرتبة ة Lab‏ على سبيل المثال» في سبيلها OY‏ تصبح» وعلى 
نحو متزايد هي القاعدة في تقنديم نتائج عمليات البحث. ولا تزال خوارزميات 
الترتيب الطبقي تختلف من نظام إلى آخر. ولا يمكن توقع أن يكون الترتيب الطبقي 
۰ لإحدى الوثاتق المسترجعة من أحد النظم» هو نفسه الخاص بالترتيب الطبقي 
من نظام ختلف. ويبدو انصهار البيانات أو اندماجهاء أي الجمع بين التعائج 
المسترجعة من نظم مختلفة» اعتمادا على طرق معينة» حلا محتملاً هذه المشكلة. فقد 
اقترح بلكن Belkin‏ وزملاؤه )1995( على سبيل SLU‏ مجموعة من الأساليب 
الخاصة بدمج نتائج عدة استراتيجيات بحث» في عدة مراصد بيانات» لإنتاج أفضل 
استجابة ممكنة لأحد الاستفسارات. ومسار دمج مراصد البيانات Database‏ 
Merging Track‏ ي مشروع مؤتمرات استرجاع النصوص (ترك (TREC‏ الذي 
نتناوله في الفصل الحادي عشر» خصص أو مكرس للتصدي لمشكلة دمج البيانات 
الواردة من مصادر غير متجانسة» لتقديم مخرجات موحدة & (Voorhess‏ 
Harman, 2000)‏ . 

وعادة ما يحظى البحث في مراصد بيانات متعددة بالدعم» من جانب مرافق أو 
متعهدي استرجاع المعلومات (مثل ديالوج (DIALOG‏ التي تدير مراصد بيانات 
متعددة» وليس نظاماً واحداً لاسترجاع المعلومات. وينهض ما يسمى ما وراء 
محركات البحث على الإنترنت» بوظيفة ممائلة بالنسبة لاسترجاع المعلومات من مصادر 
مختلفة على الإنترنت. a‏ ريدس و اليضل eee‏ 
“نظم استرجاع المعلومات". 
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اختیار تفنيات الاسترجاع: 

هناك» كا تبين في القسم السابق» تقنيات استرجاع مختلفة» يمكن للمستفيد 
النهائي أن يختار من بينها ما يناسب مهمة بحث معينة.“وهناك كثير من العوامل التي 
ينبغي أن توضع في الحسبان عند اختيار تقنيات الاسترجاع. إلا أنه في هذا القسم تركز 
مناقشة اختيار تقنيات الاسترجاع» على وظائف هذه التقنيات وأدائها في الاسترجاع. 


وظائف تقنيات الاسترجاع: 


تعمل كل واحدة من تقنيات الاسترجاع بطريقة معينة» بحيث يمكن للمستفيد 
الاعتماد عليها لتحقيق أهداف البحث الملائمة؛ فاستعمال البتر» على سبيل SLE‏ 
يسترجع مختلف أشكال المصطلحات» إذا كانت تتقاسم قطاعات مشتركة في طرق 
هجائها. وني مقابل ذلك يستوعب البحث المشوش أخطاء الهجاء وناتج التحقق من 
الأحرف ضوثياً OCR‏ إذا ما كان من الممكن أن تكون هناك بعض حالات المضاهاة 
بين الشكلين المختلفين للمصطلح. ولهذاء فإن أول سؤال يتبغي أن يطرحه المستفيد عند 
اختيار تقنية الاسترجاعء يتعلق بها يمكن لتقنية الاسترجاع (كالبحث الموزون على سبيل 
المثال) أن تنجزه. ولا يمكن للمستفيد أن يعرف ما إذا كانت تقنية الاسترجاع موضوع 
النظر مناسبة لاستفسار معين» إلا بعد الإجابة عن هذا الاستفسار. 


أداء الاسترجاع: 

يقاس أداء الاستر جاع dys bada‏ معظم الأحيان» بالتحقيق Precision‏ 
والاستدعاء Recalll‏ على الرغم من أن هذين المقياسين يشكلان دائ بؤرة مناقشات 
جدلية. ولأغراض التوضيح تركز المناقشة التالية على التحقيق والاستدعاء كمقياسين 
لأداء الاسترجاع» بين ننظر في وجهات النظر المختلفة حوطماء في الفصل الحادي عشر 
”تقييم نظم استرجاع المعلومات". 
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ويعرّف التحقيق بأنه نسبة عدد الوثائق الصا حة المسترجعة إلى مجموع الوثائق 
المسترجعة من نظام ما. ويقيس التحقيق قدرة نظام استرجاع المعلومات على التمييز؛ 
أي القدرة على فصل غير الصالح عن الصالح. فإذا تم استرجاع مئة وثيقة بعملية 
بحث cle‏ وحكم على ۳١‏ منها Lal‏ صالحة» فإن معدل التحقيق بالنسبة لعملية البحث 
هذه يكون 0" ALL‏ ويعرّف الاستدعاء» من ناحية أخرى» بوصفه نسبة عدد الوثائق 
الصالحة المسترجعة إلى إجالي عدد الوثائق الصالحة في نظام the‏ فهو يقيس القدرة 
الاسترجاعية لنظام استرجاع المعلومات. فإذا افترضنا أن هناك مئة وثيقة صالحة.” 
حول موضوع معين في نظام cls‏ وتم اسثر جاع £0 منهاء حينئذ يمكن لمعدل 
الاستدعاء لعملية البحث هذه أن يكون 5: بالمئة. وبالنسبة لكل من التحقيق 
والاستدعاء» فإنه كلا ارتفعت النسبة المئوية كان أداء الاسترجاع أفضل. إلا أنه من 
المستحيل الحصول على نتائج بحث مرتفعة في كل من التحقيق والاستدعاء نظراً 
لعلاقة التناسب العكسي بين المقياسين. 

وفي حدود ما يهم أداء الاسترجاع» فإن جميع تقنيات الاسترجاع التي نوقشت 
في القسم 61/0 يمكن تصنيفها بوصفها تؤدي إلى الارتفاع بمستوى التحقيق 
(كالمعامل البوليني AND‏ والبحث الموزون) أو تؤدي إلى الارتفاع بمستوى 
الاستدعاء (كالمعامل البوليني أو OR‏ والبحث المشوش)*. ومن ثم فإن قرار اختيار 
تقنيات الاسترجاع ينبغي أن يتم اتخاذه واضعين في الحسبان أداء الاسترجاع الذي 
يتوقعه المستفيد. فإذا كانت نتائج البحث عالية التحقيق هي المتوقعة؛ فإنه يتعين اختيار 
تقنيات الاسترجاع المقابلة» والعكس صحيح» أي أنه إذا كانت gH‏ البحث عالية 
الاستدعاء هي المتوقعة» فإنه يتعين اختيار تقنيات الاسترجاع المقايلة. . 


Xs )*(‏ أن يضاف هنا البتر. (المترجم) 
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تقنیات الاسترجاع والارتفاع بمستوى التحقيق: 

يؤدي المعامل البوليني )5 CAND‏ الارتفاع بمستوى التحقيق» وذلك بالجمع 
بين مصطلحين أو أكثر في استفسار.البحث» من أجل تحديد المضمون الدقيق لهذا 
الاستفسار. فإذا كانت هناك» على سبيل المثال» ثلاثة مصطلحات هي التصفية» 
والجدال» والعنكبوتية filtering, controversy and Web‏ في استفسار cle Cow‏ 
فإنه يمكن الحصول على نتائج دقيقة بجمع “ANDing”‏ المصطلحات الثلاثة كلها 
معاً. وإذا ما تضمن استفسار البحث مصطلحين فقطء فإن النتائج يمكن أن تزيد في 
ol‏ ولكنها تتراجع في التحقيق» نظراً لأن القيد على المصطلح الثالث قد رفع. 

أما المعامل البوليني k)‏ عدا (NOT‏ فيرتفع بمستوى التحقيق باستبعاد 
المصطلحات غير المرغوب فيها من الاستفسار. فإذا افترضنا أن المستفيد يريد البحث عن 
وثائق حول جدال التصفية» فيا يتعلق بالمواد المتؤافرة في العنكبوتية» ولكن ليس حول 
برامج التلفزة» فإنه من الممكن استعمال المعامل (ad‏ عدا NOT‏ لتحقيق ذلك الهدف. 

ويؤدي البحث بمراعاة شكل الحرف الأول Case-sensitive‏ إلى زيادة 
التحقيق» وذلك بالتمييز بين IS‏ التي تبدأبحرف كبير upper case‏ وتلك 
التي تبداً بحرف صغير lower case‏ ويوضح المصطلحان تار جت )18186 و 
Target‏ هذه النقطة؛ فإذا كان المستفيد لا يتم إلا بالعثور على الوثائق حول متجر 
تارجت Target store‏ فإن البحث بمراعاة شكل الحرف الأول يمكن أن يسترجع 
ما يريده المستفيد على وجه الدقة. وما م يكن نظام استرجاع المعلومات يدعم البحث 
بمراعاة شكل الحرف الأولء فإنه لا يمكن للمستفيد أن جد سييلاً للتمييز بين 
الشكلين المجائيين للمصطلح. ومن ثم فإن الوثائق حول كل من متجر تارجت 
Target‏ وهدف target‏ يتم استرجاعها بوصفها نتائج مشروعة» ويتأثر معدل تحقيق 
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ومعامل مع" WITH‏ الخاص بالبحث بالتقارب» طريقة أيضاً للارتفاع 
مون الخ زر راع رار يه لو ادرو يه الوط تهات ادي برطي 
المعامل ”مع“ في الوثيقة الأصلية أو بديلها. فإذا كانت صيغة البحث هي: 
OL pall”‏ مع التقنيات information WITH technology‏ فإن هذين 
المصطلحين يتعين أن يردا بالترتيب نفسه في نظام الاسترجاع. ويمكن لأي تجميعات 
أخرى للمصطلحات ole glee)‏ التقنيات» والمعلومات والتقنيات technology‏ 
information‏ ڪڇ information and technology‏ على سبيل CSL‏ آلا تسق 
عن نتائج دقيقةء lily‏ عن شوشرة 20196 في عملية البحث. ويعمل المعامل س 5 
1 على النحو نفسه» الذي يعمل به المعامل مع WITH‏ في| يتعلق بالارتفاع 
بمستوى التحقيق» إلا أنه يكفل تفاوتاً في مدى س من الكلمات بين ال صطلحين 
اللذين يربط المعامل بينهما. 

ويكفل البحث بالحقل دقة عملية البحث» وذلك بقصرها على حقل بعينه. 
فكل حقل خصص للدلالة على إحدى الخصائص المميزة للوثائق. وإذا كان 
الاستفسار حول إحدى خصائص الوثيقة me‏ على سبيل (JEL‏ فإنه من OLS‏ 
عملية البحث أن تكون أكثر دقة» إذا كانت على ذلك الحقلء ممايمكن أن 
تكون عليه عندما نجري بحثاً شاملاً في - D‏ ع الممكن للحقول الأخرى 
أن تشتمل على اسم المؤلف لأسباب مختلفة» إلا أن هذه الحقول لم يقصد بها التعبير عن 
مسئولية تأليف الوثائق. 

ويحدد البحث الموزون» وهو أسلوب آخر للارتفاع بمستوى التحقيق» أوزاناً 
لمصطلحات الاستفسار. ومادام الأمر كذلك» فإنه بمقدور المستفيد تحديد نقاط تركيز 
الاستفسار» وبذلك frat‏ على نتائج تضاهي توقعاته على نحو أكثر دقة. ولنأخذ 
صيغة عملية البحث ”التصفiة «filtering AND controversy “Jit;‏ كمثال 
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ثانية. فبإمكان المستفيد الإعراب عن التركيز على كل من المصطلحين بطريقة مختلفة» 
وذلك بتحديد وزنين مختلفين [A‏ وإذا ما حظي مصطلح ”الجدال“ بالوزن الأعلىء 
حينئذ يكون تركيز الاستفسار على ”التصفية“ بوصفها ”جدالا“. وبعبارة أخرى» 
فإنه يمكن للمستفيد أن يكون أكشر دقة بالنسبة لاستفسار معين عندما يستعمل 
البحث الموزون. وقصارى القولء فإن المعاملين ”و“ و”فيه| عدا“ ني البحث 
البوليني» والبحث بمراعاة شكل الحرف الأول من الكلمةء والمعامل ”مع“ في 
البحث بالتقارب؛ والبحث بالحقل» والبحث الموزون» ويمكن أن تستعمل كلهاء 
بقدراتها المختلفة» للارتفاع بمستوى التحقيق في مهام الاسترجاع. 


ققنيات الاستر جاع والارتفاع بمستوى الاستدعاء: 


لا يشترط المعامل البوليني ”أو“» كما سبق أن تناولناه» سوى ورود أي من 
المصطلحين اللذين يربط بينهماء في الوثيقة المسترجعة. ومن ثم فإن نتائج عملية 
البحث من المفترض أن تزيد في عددهاء ومن ثم في الاستدعاء. فإذا كان الاستفسار 
هو ”التصفية أو الجدال'“ filtering OR controversy‏ على سبيل JU‏ فإن عملية 
البحث تسفر عن نتائج مناسبة عندما يرد أي من المصطلحين ”التصفية “filtering‏ 
أو “controversy JILL!”‏ في النظام. وتبدو القيود على عملية البحث بالمعامل 
”أو“ أقل بالمقارنة بالمعاملين البولينيين الآخرين ”و“ و”فيها عدا“. وكلما قلت القيود 
في عملية البحث ارتفع الاستدعاء. 

ويؤدي البتر إلى توسعة نتائج عملية البحث» بالسماح لجزء بعينه من الممصطلح 
. أن يتسخذ أشكالا مختلفة» مادامت النتائج تتقاسم فيا بينها عنصرا واحدا مشتركا 
(وليكن جذع الكلمة على سبيل المثال). وني هذه الحالة تدخل جميع أشكال جذع 
الكلمة في الحسبان في عملية البحث؛ فمن شأن استفسار للبحث عن ”الدوريات 
الإلكترونية“ SLM dee be sejournal*‏ أن يسستر جع وثائق تشتمل عل 
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.ejournal‏ أو ejournals‏ أو .ejournalism‏ أو ejournalist‏ أو أي مصطلح 
آخر يتصدره المقطع ejournal‏ ومن ثم فإن الاستدعاء بالنسبة لعملية البحث هذه 
يمكن أن يكون ولاشك أعلى ما يمكن أن يكون عليه بالنسبة لعملية بحث لم يتم فيها 
بتر مصطلح الاستفسار. وعندما يتم بتر مصطلح عملية البحث (Se. ejournal)‏ 
فإن نتائج البحث لن تشتمل إلا على تلك الوثائق التي ورد فيها المصطلح مبجائه الذي 
ورد في الاستفسار على وجه التحديد. 

ويكفل المعامل ”قريب“ NEAR‏ للبحث بالتقارب» الفرصة لاسترجاع المزيد 
من الوثائق الصالحةء بالسماح للمصطلحات التي يربط بينها المعامل OY‏ ترد بأي 
ترتيب في مرصد بيانات النظام. ومن ثم» فإن عملية بحث تتم بناء على ”ا معلومات“ 
قريب من ”التقنيات “ information NEAR technology‏ يمكن أن تسترجع 
الوثائق حول ”تقنيات information technology “ola sall‏ أو ”معلومات 
technology information “<LI‏ وبذلك تزيد احتالات ارتفاع الاستدعاء. 
ويعمل المعامل ”س قريب“ NEAR‏ على نحو ماثل لعامل ”قریب“ 2/8412 إلا 
أنه أوسع قدرة على الاستيعاب» وذلك بالسماح بوجود أوجه اختلاف في حدود مدى 
س من الكلمات بين المصطلحين اللذين يربط المعامل ”س قريب" فيا بيتهما. 


ويمكن للبحث المشوش fuzzy‏ أن يؤدي إلى الارتفاع بمستوى الاستدعاء 
بالكشف عن الأخطاء الناشئة عن الحجاء غير الصحيح» وأخطاء نظام التحقق من 
الأحرف بصرياً OCR‏ والمصادر الأخرى cole WU‏ وتصويب هذه الأخطاء. فإذا 
كانت هناك وثيقة حول ”الماتف الخليوي“ cellular phone‏ إلا أنه حدث خطأ في 
هجاء المصطلح فأصبح Celluler phone‏ فإنه يمكن للبحث باستعمال أسلوب 
التشويش» أن يظل قادرا على استرجاع Las gl‏ وبذلك يزداد الاستدعاء بالنسبة 
diesels‏ 
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وتبدف توسعة الاستفسارات إلى استرجاع المزيد من النتائج الصالحة» وذلك 
بتعديل الاستفسارء بناء على الدفعة السابقة من نتائج الببحث. ومن الممكن لعملية 
التعديل هذه أن تتكرر» إلى أن يتم الحصول على نتائج Lie‏ كافية. والاستدعاء 
مقياس نسبة الوثائق الصا حة المسترجعة إلى كل ما يتوافر في النظام حول موضوع 
الاستفسار» هو العامل الذي يمكن الارتفاع بمستواه ولا شك» بتوسعة 
الاستفسارات. فمن الممكن» على سبيل المثال» للجولة الأولى من عملية tered‏ أن 
تسترجع خمس وثائق فقط صا حة بالنسبة للاستفسار ”أنموذج الفضاء المتجهي“ 
vector space model‏ وبعد النظر في النتائج التي يتم الول G Sia gle‏ 
يضاف اسم سالتون Otte Salton, G)‏ إلى استفسار جديد للجولة الثانية لعملية 
البحث. فإذا ما تم استرجاع ست وثائق صا حة أخرى نتيجة لذلك» فقد ارتفع 
الاستدعاء على نحو ملحوظ. 

ويكفل البحث في مراصد بيانات متعددة فرصة أخرى للارتقاء بالاستدعاء 
نظراً للاعتماد على المزيد من مراصد البيانات في عملية البحث. وحينا يتم بحث 
استفسار في عدة مراصد للبيانات» فإن فرصة الحصول على عدد أكبر من النتائج 
الصا حة» تكون أكبر E‏ يمكن أن يسفر عنه إجراء البحث في نظام استرجاع معلومات 
واحد فقط. وفضلاً عن ذلك» فإنه من الممكن لكل نظام لاسترجاع المعلومات» أن 
يشتمل على كميات معينة وفئات منتقاة فقط من المعلومات. إلا أنه من الممكن 
لمجموعة من نظم استرجاع المعلومات أن تشتمل» ولا شك» على فئات متنوعة من 
المعلومات وبكميات أكبر مما يمكن أن يتوافر في نظام واحد. 

وكا بيناء OB‏ كلا من معامل ”أو“ OR‏ للبحث البوليني» والبتر» ومعامل 
“قريب NEAR‏ للبحث بالتقارب» والبحث المشوش» وتوسعة الاستفسارات» 
والبحث في مراصد بيانات متغددة» كل هذه يمكن أن تؤدي إلى توسعة عمليات 
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البحث بطريقة أو بأخرى. وعلى الرغم من أن المزيد من النتائج» لا يمكن بالضرورة 
أن يسفر عن استدعاء مرتفع » فإنه يمكن أن تزيد احتمالات الحصول على المزيد من 
النتائج الصا حة بالنسبة لاستفسار معين. يضاف إلى ذلكء أنه بالإلمام بالطريقة التي 
تؤثر بها كل تقنية من تقنيات الاسترجاع» في معياري الاستدعاء والتحقيق بالنسبة 
لهام البحثء» يمكن للمستفيدين اتخاذ قرارات صائبة» في اختيار تقنيات الاسترجاع 
الملائمة لعمليات البحث الخاصة بهم. 


التعببر عن الاستفسارات: 

ينبغي الإعراب عن الحاجة إلى المعلومات» شفوياً أو تحريرياًء قبل أن يكون 
بالإمكان إجراء عملية البحث اللازمة لتلبية هذه الحاجة. وتسمى الحاجة إلى 
المعلومات التي يتم الإعراب عنهاء بطلب البحث أو طلب الاسترجاع» الذي عادة ما 
يكون باللغة الطبيعية. ومن الممكن حينئذ تحويل طلب البحث إلى استفسار باستعمال 
إمكانيات نظام استرجاع المعلومات» كقواعد صياغة الاستفسارء وإجراءات 
الاسترجاع» واللغة المقيدة إذا كان النظام يستخدم لغة مقيدة. وتسمى عملية التحويل 
هذه بالتعبير عن الاستفسار أو تمثيل الاستفسار» وهي أكثر العوامل أهمية في 
الاستر جاع )2000 .(Sparck Jones,‏ 


الخطوات العامة: 
التعبير عن الاستفسار عملية فكرية» عادة ما تتكون من الخطوات التالية: 


أو الأوجه. 
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۲. التفكر في المترادفات» والمصطلحات الأعرض» والمصطلحات الأضيق 
الخاصة بالمفاهيم التي تم التحقق منها. 
۳. ترجمة هذه المصطلحات إلى اللغة المقيدة» إذا كان النظام يستخدم لغة مقيدة. 
od‏ استعمال المنطق البوليني للتعبير عن علاقة البدل “OR”‏ بين get‏ 
المصطلحات المترادفة في كل مجموعة من المفاهيم» وجمع “AND”‏ الأوجه 
المناسبة» ثم استبعاد NOT”‏ أي أوجه غير مرغوب فيها. 
0 استخدام تقنيات استرجاع أخرى a>‏ تدعو الحاجة. 
وعلى الرغم من أن هذه الخطوات ليست جامدة أو cde jhe‏ فإنها تشكل جوهر 
التعبير عن الاستفسارات. ومن الممكن أن تكون هناك بعض أوجه الاختلاف في 
الممارسات. ldg‏ يل مناقشة تحليلية متأنية لعملية التعبير عن الاستفسارات» نظرا لما ها 
من دور حاسم في استرجاع المعلومات. 
تحليل المفاهيم: 
الخطوة الأولى في التعبير عن الاستفسار هي تقسيم طلب البحث إلى مجموعات 
من المفاهيم أو الأوجه؛ فطلب البحث» على سبيل المثال» هو العثور على الوثائق التي 
تعالج تنقية العنكبوتية العالمية بوصفها موضوعاً جدلياًء لا بوصفها من تقنيات 
المعلومات. ويتبين بعد التحليل أن هناك ثلاثة مفاهيم واضحة المعالم في طلب البحث» 
|S‏ يتضح في الجدول رقم ١/١‏ . 
الجدول رقم 1/0 LAE‏ مفاهيم طلب بحث 


| (1) المفهوم‎ CY) المفهوم‎ O) المفهوم‎ 
a 
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وقد تصادف في هذه الحالة» أن كانت المصطلحات التي يتضمنها الطلب هي 
نفسها المفاهيم التي ينطوي عليها الموقف. إلا أن هناك مواقف لا يكون فيها تطابق تام 
بين المصطلحات والمفاهيم» فمن الممكن على سبيل المثال» لطلب بحث أن يشتمل على 
م صطلحي ”الحافلات“ buses‏ و ”مترو الأنفاق“ subways‏ إلا أن المفهوم 
الأساس يتعلق ”بالنقل العام“ public transportation‏ وعلى ذلك فإن fas”‏ 
العام“ public transportation‏ وليس الحافلات “GLa! gie” g buses‏ . 
‘Subways‏ ينبغي أن يستعمل لأغراض التعبير هنا. يضاف إلى ذلك أن الأسماء أو 
العبارات الاسمية فقط هي التي ينبغي أن تستعمل للتعبير عن المفاهيم. أما الأفعال» 
إن وجدت في الطلب» فيتم التعبير عنها بالمعاملات البولينية. ولا ينبغي اختيار أجزاء 
الكلام الأخرى للتعبير عن المفاهيم التي أمكن التحقق منها في طلب البحث. 
اختلاف المصطلحات: 

للمصطلحات في غالب الأحيان مترادفات» ومصطلحات أعرض» 
ومصطلحات أضيق» فضلاً عن التنويعات اللأخرى. وهدف هذه الخطوة في التعبير 
عن الاستفسار هو التفكر أو تدبر أكبر عدد من التنويعات» حسبما تقضي اتضرورة» 
بالنسبة للمفاهيم التي سبق التحقق منهاء حتى يمكن التعبير عن المفاهيم على نحو 
شامل. ويوضح الجدول رقم Y O‏ التنويعات المحتملة بالنسبة للمفاهيم الثلاثة التي 
تم التحقق منها في الخطوة السابقة. 
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الجدال 













تقنيات الشبكات التنقية 
oka‏ الحاسبات الرقابة 


تنقية العنكبوتية العالمية 
الرقابة على العنكبوتية 
العالمية 

وکا تبين في الجدول رقم 0/ ٠۲‏ فإنه لم يتم تسجيل جميع تنويعات المصطلحات 
المحتملة» نظراً لأسباب كالذيوع أو الانتشار أو الألفةء وكذلك الإيجاز. فتحت 
المفهوم )١(‏ على سبيل SL‏ لم نورد ”العنكبوتية World Wide Web “abla!‏ 
كشكل مختلف بالنسبة ”للعنكبوتية Web‏ ويتوقف القرار حول ما إذاا OLS‏ من 
المتعين تسجيل مصطلح بعينه» على عدة معايير ذاتية subjective‏ كالاستدعاء 
المتوقع» ومدى التآلف مع الموضوع. وفي الوقت الذي لايتم فيه تضمين جميع 
الأشكال المختلفة للمصطلح في الاستفسار النهائي» بالنسبة لعملية البحث. فإنه 
يمكن لتسجيل عدد من الاحتالات» أن يساعد في اختيار م صطلحات الاستفسار 
المرشحة. ويمكن لعملية تسجيل الأشكال المختلفة للمصطلحات. أن توفر أيضاً 
مصطلحات مداخل لاختيار المصطلحات المناسبة من اللغة المقيدة» إذا كان النظام 
يستعمل إحدى هذه اللغات. 
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تحويل المصطلحات: 

إذا كانت إحدى اللغات المقيدة تستخدم كلغة لاسترجاع المعلومات» فإن 
المصطلحات التي يتم التعبير عنها بلخة طبيعية في الخطوة السابقة» ينبغي أن تحول تبعاً 
لذلك إلى اللغة التي وقع عليها الاختيار. ومام يكن الأمر كذلك» فإنه يمكن 
للمستفيد التجاوز عن هذه الخطوة في التعبير عن الاستفسارء والانتقال إلى الخطوة 
التالية. ويشترط التحويل التآلف مع اللغة المقيدة المستخدمة» كا يمكن أن يسلك أيا 
من الطرق التالية: 

« المقابل الدقيق: أن يكون للمصطلح الوارد» مقابل دقيق في اللغة المقيدة. 
ويبدو ذلك أيسر خيار من بين جميع طرق التحويل. 

« المترادفات أو المصطلحات المتصلة: ليس للمصطلح موضوع النظر سوى 
مترادفات أو مصطلحات متصلة فقط في اللغة المقيدة. وينبغي العمل على 
اختيار المصطلح الأقرب في معناه إلى المصطلح الذي يتم تحويله. 

٠‏ المصطلحات الأعرض: ليس للمصطلح الوارد سوى مصطلحات أعرض 
منه فقط في اللغة المقيدة. ومن شأن دقة المصطلح الأصلي أن تتاثر سلباً نتيجة 
هذا التحويل. 

° المصطلحات الأضيق: ليس للمصطلح موضوع النظر سوى مصطلحات 
أضيق منه في اللغة المقيدة. ومن شأن Sle‏ المصطلح الأصلي أن يتقلص من 
جراء هذا التحويل. 

٠‏ المصطلحات غير الواردة: أن يكون المصطلح المراد تحويله اسم علم (اسم 
جديداً لا نظير له في اللغة المقيدة. ويتعين في هذه الحالة إيجاد مصطلح جديدء 
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يسمى محدد i Al‏ أو المعرف identifier‏ لأغراض التحويلء إذا حدث أن 
كان المستفيد اختصاصى معلومات. ومن الممكن إلى حد بعيد في هذه الحالة» 
أن يكون المصطلح الجديد هو نفسه المصطلح المراد تحويله. 
leds‏ عدا طريق المقابل الدقيق» تشترط جميع طرق التحويل الأخرى تفسير 
المصطلحات. وتتحكم Bo‏ التفسير سلفاً في دقة عملية التحويل. 
استخدام المعاملات البولينية: 
إذا افترضنا أن كانت جميع المصطلحات التي جمعت تحت كل مفهوم في الجدول . 
رقم 0/ ؟ في الشكل الصحيح» فإن الخطوة التالية هي استخدام ا معاملات البولينية» 
لربط المصطلحات والمفاهيم التي سبق التحقق منهاء وفقاً لما بينها من غلاقات. وعلى 
الرغم من أنه من الممكن أن تكون هناك بعض مظاهر التفاوت في التطبيق» فإن هناك 
قاعدتين عامتين لاستعمال المعاملات البولينية: 
١‏ ربط المصطلحات في مجموعة المفهوم نفسها (كجميع المصطلحات الواردة في 
عمود ماني الجدول رقم 0/ Y‏ مثلاً) با معامل ”أو“ FOR‏ 
۲. ربط كل مفهوم في طلب البحث (أي في الصف في الجدول رقم 0/ (Y‏ 
بالمعامل ”و“ AND‏ أو المعامل ”في) عدا“ (NOT‏ تبعاً للحاجة. 
ويوضح الشكل رقم 5/ Y‏ هذه العملية Ly pay‏ بمجموعات المفاهيم التي 
وردت في الجدول رقم 5/ 7 بالنسبة Sth‏ طلب البحث. 
ويبدو أن هناك نقطتين بحاجة إلى توضيح بشأن الشكل رقم 5/ CLAY EY‏ 
كم ote‏ المصطلحات من كل مجموعة من مجموعات المفاهيم» يمكن أن يتضمنها 
الاستفسار؟ وبعبارة أخرى» كم مصطلحاً ينبغي الربط بينها معا بالمعامل أو COR‏ 
للتعبير عن كل مفهوم أمكن التحقق منه؟ وتتوقف الإجابة في الأساسء على عدد 
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النتائج التي يتوقع المستفيد الحصول عليها. وكلم| زاد عدد المصطلحات المرتبطة معاً 
بالمعامل ”أو“ OR‏ ازداد عدد النتائج التي يتلقاها المرء. وعلى النحو نفسهء فإنه كلما 
قل عدد المصطلحات المرتبطة معا بالمعامل ”أو“ OR‏ انخفض عدد النتائج التي 
يمكن أن يحصل عليها المرء. والأسلوب المألوف المتبع في اتخاذ مثل هذا القرار» هو 
وضع جميع المصطلحات الواردة مرتبة وفق أولويات» ثم اختيار المصطلحات القليلة 
الأولى الواردة في القائمةء لكي يتم ربطها bea‏ بالمعامل ”أو“ 0۸ تبعاً لحاجة المرء. ولا 
نحدد في الشكل رقم 0/ ۲ كم مصطلحاً يمكن أن تستعمل للتعبير عن المفهوم 
المقابل. وكل ما هنالك أنه يفضل أن نبين أن هناك مصطلحات أخرى متاحة للمعامل 
”أو“ OR‏ 

والنقطة الثانية في الشكل رقم ۲/١‏ التي تحتاج إلى توضيح» هي استعمال 
الأقواس؛ ففي مناقشتنا للبحث البوليني» في القسم N ANAN SO‏ عرضنا ترت 
التجهيز بالنسبة لعمليات البحث البوليني المركبة. والمثال الموضح في الشكل رقم 
٥‏ عملية بحث بوليني مركبة» تتطلب استعمال الأقواس لتغيير القرتيب الطبيعي 
للتجهيز. وما لم تستعمل الأقواس فإنه يمكن لنتائج عملية البحث أن تكون أي شيء» 
إلا ما كان المستفيد يقصد من وراء عملية البحث. وإذا افترضنا Lal‏ استبعدنا جميع 
الأقواس في الشكل رقم 0/ cY‏ واحتفظنا بجميع المصطلحات المقترحة في ذلك 
الشكلء وبالترتيب نفسه أيضاًء فإنه يمكن للمصطاح الأول الوارد تحت المفهوم ٣‏ 
(أي تقنيات المعلومات) أن يتم استبعاده من مجموعة النتائج التي تنشأ في) يتعلق 
بالمصطلح الأخير الوارد تحت المفهوم Y‏ (أي ”النزاع“ (dispute‏ كذلك يمكن أن 
Las‏ نتائج أخرىء غير متوقعة في النهاية. ومن ثم فإنه ينبغي استخدام الأقواس إذا 


كان للترتيب الطبيعي للتجهيز أن يتغير. 
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وتفسر أهمية الأسلوب البوليني في استرجاع المعلومات نفسها بنفسها؛ إذ يتعين 
استخدام المنطق البوليني في التعبير عن الاستفسار» مالم تكن عملية البحث تشتمل 
على مصطلح واحد فقط. إلا أن تطبيق عملية البحث البوليني أكثر تعقدا بالفعل Le‏ 
تبدو. وللمزيد من مناقشة تعقد البحث البوليني ومشكلاته» راجع الفصل السابع 
٠‏ “ناذج استرجاع المعلومات . 


المفهوم ۳ المفهوم Y‏ المفهوم ١‏ 
| تقنيات المعلومات | الجدال تنقية العنكبوتية 
فيما عدا e‏ 


أو 
المصطلحات الأحرى 


أو او 
المصطلحات الأحرى المصطلحات الأخرى 





الشكل رقم 0/ Y‏ تطبيق المعاملات البولينية 
استعمال تقنيات الاسترجاع الأخرى: 
هناك الكثير من التقنيات الأخرى التى يمكن للمستفيد اتباعها للتعبير عن 
الاستفسار بدقة ووضوح؛ فبالنسبة لعملية بحث ”تنقية العنكبوتية ‘Web filtering‏ 
على سبيل المثال (انظر الجدول رقم /١‏ ۲) يمكن للمستفيد النظر في: 
« ما إذا كان البحث بمراعاة شكل الحرف الأول متاحاً للتمييز» حيث تدل 
Web‏ على العنكبوتية العالمية «World Wide Web‏ وتعني web‏ نسيج العذكبوت 
.spider web‏ 
٠‏ ما إذا كان من الممكن بتر المصطلح „debate‏ 
* ما إذا كان من الممكن استعمال معاملات التقارب مثل ”مع“ WITH‏ أو 
”قريب“ NEAR‏ للتعبير عن ”تقنيات information “OL pall‏ 
.technology‏ 
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o‏ ما إذا كان من الممكن لعملية البحث أن تقتصر على حقول معينة» كحقل 
العنوان أو حقل الواصفات. 
٠‏ ما إذا كان نظام استرجاع المعلومات الذي وقع عليه الاختيار يدعم البحث المشوش. 
٠‏ ما إذا كان من الممكن تحديد أوزان لأي من المصطلحات التي وقع عليها الاختيار. 
o‏ ما إذا كان التلقيم المرتد الخاص بالصلاحية يحظى بدعم النظام» أو ماإذا 
كانت توسعة الاستفسار يمكن أن تتم يدوياً. 
٠‏ ما إذا كان من الممكن البحث في مراصد بيانات متعددة. 
وکا سبق أن بيناء فإن قليلاً من نظم استرجاع ا معلومات» تكفل جميع إمكانيات 
البحث التي ناقشناها حتى الآن. ومن ثم فإن قائمة تقنيات الاسترجاع هذه lol‏ هي بمثابة 
قائمة مراجعة» وليست قائمة '“ملزمة“. وفي هذه المرحلة يمكن للاستفسار أن يكون قد 
تم التعبير عنه كاملا وأصبح جاهزاً لأن يقدم لإجراء عملية البحث. 
والتعبير عن الاستفسارء بوصفه تعبيراً عن مواصفات المعلومات» عملية 
معقدة إلى حد بعيد. وعلى الرغم من أننا قد baad‏ هذه الخطوات الخمس» لتوضيح 
النقاط الجوهرية في التعبير عن الاستفسارء فإن التطبيق الفعلى قد لا يتكون من العدد 
نفسه من الخطوات» أو لا يتبع الترتيب نفسه. فالمستفيدون المتمرسون» على مسبيل 
المثال» يميلون للجمع بين بعض الخطوات (ey ches‏ يمكن للمستفيدين المبتدثين أن 
يكونوا عزوفين عن اتباع أي مسارات مختصرة. 
وخلاصة القول» فإن الخطوة ١‏ في التعبير عن الاستفسارات» تتعلق بتحليل 
parsing‏ طلبات البحث إلى مفاهيم» res‏ الخطوتان ۲ و٣‏ بتر a‏ المفاهيم 
إلى مصطلحات الاستفسار. أما الخطوتان ٤‏ وه فتركزان على تطبيق مختلف 
أساليب الاسترجاع. 
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يختلف» فإن التعبير عن الاستفسار ينبغي أن يبرز هذه الظاهرة» بوضع تفرد العملية أو 
اختلافها في الحسبان. 
مشكلات par!‏ عن الاستفسارات: 

التعبير عن الاستفسارات. ك| ناقشناه» ليس عملية ميكانيكية» [ily‏ عملية 
فكرية» تتطلب إعمال العقل والاجتهاد. يضاف إلى ذلك أن هذه العملية الفكرية 
تنطوى على عدة مشکلات. à i‏ 

ويعد تحليل المفاهيم أولى المشكلات في التعبير عن الاستفسارات؛ إذ ينبغي أن 
تتوافر للمستفيد المعرفة الكافية» والخبرة» والمهارات لكي يتجقق من المفاهيم التي . 
يتضمنها طلب البحث» والتعبير عن هذه المفاهيم. ومن الممكن للذاتية أن تتسلل 
بسهولة إلى العملية. والتحليل غير الدقيق ليس بالظاهرة غير المألوفة. 

واللغة هى المشكلة الثانية في التعبير عن الاستفسارات؛ فاللغة الطبيعية ثرية» 
مرنة» غامضة» ومبهمة في بعض الأحيان. [ey‏ اللغة المقيدة جامدة» ومصطنعة» ومن 
الصعب المحافظة على تجددها. إلا أن طلب البحث ينبغى التعبير عنه بأقصى درجات 
الدقة بكل من اللغتين. ويمكن لهذا التحويل أن يؤدي إلى بعض مظاهر التفاوت في 
عملية التعبير» ويؤثر في أداء الاسترجاع في النهاية. ويضاعف استعمال اللغة المقيدة 
من صعوبة التعبير عن الاستفسارات» نظراً لأن تآلف المستفيد مع هذه اللغة يتطلب 
Ly‏ وجهداً. dy‏ مقابل ذلك فإن لاستعمال اللغة الطبيعية في التعبير عن 
الاستفسارات سلبياته كا بينا في الفصل الرابع. 

ويثير استخدام تقنيات الاسترجاع المناسبة مشكلة أخرى في التعبير عن 
الاستفسارات؛ فكل نظام لاسترجاع المعلومات يحدد معام مواصفاته وطريقة 
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استعماله فيم| يتعلق بأساليب الاسترجاع (فعلامة زائد + على سبيل المثال» تعني في 
بعض نظم استرجاع الإنترنت المعامل البوليني و" AND‏ بين] تستخدم في نظم 
أخرى رمزاً للوزن). كذلك يستنفد التمكن من استعمال هذه الأساليب Ly‏ كما 
يتطلب المارسة. 

ومن الممكن لكل هذه المشكلات أن تؤدي إلى افتقار التعبير عن طلبات 
البحث إلى الدقةء الأمر الذي يفضى في النهاية إلى أخطاء المضاهاة بين التعبير عن 
الاستفسار الما قات المعلومات. وللتغلب على هذه المشكلات يمكن 
تثقيف المستفيد» وتدريبه من ناحية» والسعي وراء اختراقات أو تطورات جوهرية في 
البحث العلمي حول التعبير الآلي عن اا 


الأسلوب TY!‏ 
هناك رغبة ملحة في التعبير عن الاستفسارات UT‏ إذا ما كان بالإمكان فعلاً 
تحقيق ذلك. فالأسلوب الآلي؛ شأنه شأن التكشيف الآلي والطرق الآلية الأخرى 
لمعالحة النصوصء يتوقف إلى حد بعيد على خصائص من قبيل تردد IAS‏ 
المفتاحية» والتقارب» والموقع. كذلك تطبق الخوارزميات القائمة على الاحتالات» 
واللغويات الحاسبيةء والذكاء الاصطناعي Lal‏ في بعض الأحيان. إلا أنه على عكس 
التكشيف الآلي» الذي ينطوي على أنشطة ميكانيكية وفكرية في الوقت نفسه. فإن 
التعبير عن الاستفسارات آلياً لا يتتضمن سوى مكون فكري فقط. ولما كانت 
الحاسبات لا تزال غير قادرة على التفكير كالإنسان» فإنه ليس من الصعب تصور 
المشكلات التي يمكن أن تثارء إذا ما ألقي على الحاسبات عبء المهمة الفكرية الخاصة 

االتعبير عن الاستفسارات. 
وقد اختبر الباحثون في استرجاع المعلومات التعبير عن الاستفسارات GAT‏ 
الماضي. كذلك حظي الأسلوب الآلي باهتام مكثف في مشروع موتمرات استرجاع 
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النصوص ”ترك“ TREC‏ وقد تبين» على سبيل المثال» أن الاستفسارات التي تصاغ 
آلياء من ال موضوعات topics‏ كانت تعمل |S‏ تعمل الاستفسارات التي تصاغ يدويا 
إن لم يكن أفضلء في المرحلة الأولى من مشروع ترك TREC 1 ١‏ ولم يكن هناك تميز 
أو تحسن واضح نتيجة لإعداد الاستفسارات يدويأ )1995 Jones,‏ علءمةم5). ds‏ 
المرحلة الرابعة» ترك TREC 4 ٤‏ كان هناك قليل من النتائج الآلية القابلة للمقارنة 
بالنتائج اليدوية» أو تضارعهاء بالنسبة للاستفسارات القصيرة. إلا أن الاتجاه في ترك 
o‏ وترك ‏ يرجح الصياغة اليدوية للاستفسارات» التي تتم عادة للاستفسارات 
الطويلة» إلى حد يفوق أداء الصياغة الآلية للاستفسارات بوضوح. بالنشبة 
للاستفسارات الطويلة نفسها )2000 (Sparck Jones,‏ ويشتمل الفصل الحادي 
عشر على المزيد من المناقشات حول سلسلة ترك TREC‏ 

وعلى الرغم من أن نتائج سلسلة ترك TREC‏ ليست sle‏ أو حاسمة» Lep‏ 
تظهر قصور الأسلوب DW‏ على ضوء الوضع الراهن للبحوث في هذا المجال. 
وهناك حاجة إلى المزيد من الجهد للارتفاع بمستوى الطريقة الآلية للتعبير عن 
الاستفسارات. | 
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الفصل السادس 
طسرق الاستسرجساع 


من الممكن تحقيق استرجاع المعلومات بالبحث أو التنقيب «searching‏ 
أو بالتصفح browsing‏ أو بالطريقتين معا. ويتوقف اختيار طريقة الاسترجاع المناسبة 
على طبيعة حاجة المستفيد إلى المعلومات» وذلك من بين عوامل أخرئ. ونحاول في هذا 
الفصل استكشاف الطرق الثلاث المختلفة للاسترجاع» إلى جانب خصائص هذه 
الطرق وتطبيقاتها. 

وقد صاغ كل )2000( Kall‏ التناظر الوظيفي التالي» عند مناقشة استرجاع 
المعلومات. فقد ذهب إلى أن العثور على إبرة (أي وثيقة أو معلومات) في كومة تبن 
haystack‏ (أي نظام استرجاع المعلومات أو مرصد البيانات (database‏ يمكن 


أن يعني: 
.١‏ إبرة معروفة في كومة تبن معروفة. 
۲. إبرة معروفة في كومة تبن غير معروفة. 
Y‏ إبرة غير معروفة في كومة تبن غير معروفة. 
5. أي إبرة في كومة ما. 
0„ أمضى sharpest‏ إيرة في كومة التبن. 
.٦‏ معظم أمضى الإبر في كومة التبن. 
. جميع.الإبر في كومة التبن. 


209 


8. تأكيد غياب الإبر في كومة التبن. 

4. أشياء تشبه الإبر في كومة التبن . 

geo.)‏ أعرف متى تظهر إبرة جديدة. 

.١‏ أين أكوام التبن. 

۲. الإبر أو أكوام التبن = SLT‏ 

وقد أمكن في القائمة السابقة حصر OV OV‏ المختلفة بشأن الإبرة وكومة 
التبن» إلا أن هذا الحصر لم يحقق الشمول. وما لا شك فيه» أن البحث أو التنقيب هو 
الطريقة المناسبة لحالات معينة (رقم ١‏ على سبيل المشال)» ويبدو التصفح ملائ 
لحالات أخرى (رقم ٠١‏ على سبيل المثال). ويمكن لبعض ال حالات في القائمة (رقم ه 
على سبل المثال) أن تتطلب الاستخدام المشترك لطريقتي الاسترجاع. 


الاسترجاع بالبحث: 

البحث أو التنقيب searching‏ طريقة للاسترجاع» تستخدم منذ زمن طويل. 
وهو أيضاً موضوع [Slo‏ ما يحظى بالمعالجة في استرجاع المعلومات» حيث يمكن أن 
يسمى البحث في مراصد البيانات» والبحث على الخط المباشرء والبحث في العنكبوتية 
العالمية» أو ما شابه ذلك. وبمجرد أن يتم التعبير عن الاستفسارء يكون المستفيد 
مستعداً لإجراء عملية البحث» من أجل استرجاع المعلومات من النظام. 

يقصد بالبحث بادئ ذي بدء العثور على ما يمكن أن يضاهي المصطلحات 
المحددة الواردة في الاستفسار. باتباع Le‏ تقنيات الاسترجاع التي تناولناها في 
الفصل الخامس. ومن الممكن إجراء البحث عن طريق أي من نقاط الوصول access‏ 
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:points‏ الموضوعية أو غير الموضوعية. وعادة ما تشمل bla‏ الوصول الموضوعية» 
2 نظم استرجاع المعلومات» الواصفات «descriptors‏ أو المعرفات أو محددات 
الموية cidentifiers‏ أو وسيرات أو رموز التصنيف. أو رؤوس الموضوعات. أو 
المراجع المستشهد بهاء في البحث بالاستشهاد المرجعي» والمصطلحات الواردة في 
العناوين» والمستخلصات. أو النص نفسه. في البحث في النصوص الكاملة 
(Hjørland, 1997)‏ وتشمل نقاط الوصول غيز الموضوعية المألوفة» اللغة» وسنة 
النشرء ونوع الوثيقة» وما شابه ذلك. 

ويمكن للبحث أن يكون طريقة استرجاع فعالة» عندما يكون الاستفسار 
محدداء والمستفيد على دراية على وجه اليقين با هو بصدد البحث عنه. فإذا كان 
المستفيد يود على سبيل المثال» العثور على كل بحوث سالتون Salton‏ التي نشرت 
في تسعينيات القرن العشرين» فإنه يمكن للبحث بحقل المؤلف وحقل عام النشرء أن 
يسفر عن النتائج المتوقعة". أما إذا كان المستفيد يود التعرف على سبيل المثال» على كل 
أولئك الذين سجلوا إسهامات في جال استرجاع المعلومات» فإن البحث وحده لا 
يمكن أن يلبي هذه الحاجة. 

وني طريقة البحث» يمكن لتقنيات البحث كالمنطق البوليني» أن تكفل 
للمستفيد الجمع بين مختلف الأوجه في استفسار البحث» حيث| تدعو الحاجة. 
وباستثناء بعض نظم استرجاع الإنترنت» فإن معظم نظم استرجاع المعلومات تدعم 
إدخال المزيد من التعديل في استفسارات البحث» بمساعدة تقنيات الاسترجاع 
الملائمة (كالبحث بالحقل على سبيل (JEU‏ وبإمكان النظام إنجاز كل هذه المهام. 
بمجرد أن تقدم له كعناصر في الاستفسارات. وهذه العملية مباشرة صريحة» ولا تلقي 
بعبء معرفي ثقيل على كاهل المستفيد. 


(C)‏ وذلك بالربط بين الوجهين با عامل البوليني AND “gy”‏ بالطبع. (المترجم) 
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غير أن البحث blis‏ منضبط؛ وقلا تكون هناك فرصة للصدفة (أي اكتشاف 
شيء له قيمته فعلاً ولكنه لم يكن متوقعاً أثناء إجراء (toed‏ ذلك OY‏ النظام لا يقدم 
سوى تلك النتائج التي تضاهي الاستفسار. يضاف إلى ذلك أن مهارات البحث لا 
تتحقق طبيغياً أو بالفطرة؛ إذ يتعين على المستفيد أن يتعلم كيف يبحث» وعليه أن 
يتمرس حتى يتمكن من إجراءات البحث. ويمكن لتكلفة التعلم والتمرس أن تكون 
عالية» إذا كان التعامل مع نظام استرجاع المعلومات يتم مقابل رسوم. 
أنواع عمليات البجحث: 

من الممكن تقسيم عمليات البحث إلى أنواع مختلفة Las‏ لأغراض البحث؛ 
فعندما يكون لدى المستفيد وثيقة معينة في ذهنه» فإن البحث يسمى البحث عن وثيقة 
أو عن dale‏ وعادة ما يتم إجراء البحث عن dale‏ معروفة بوجه ely cele‏ على خواص 
وثيقة معروفة» كاسم المؤلف والعنوان. والمناظر الوثيق للبحث عن وثيقة معروفة هو 
ما ذهب إليه كل (2000) Koll‏ ”إبرة معروفة في كومة تبن معروفة . 

وعندما يختار المرء موضوعات للبخث» فإنه يجري بحثا في الإنتاج الفكري 
لاكتشاف ما إذا كان هناك باحثون آخرون أنجزوا أي عمل في هذا المجال. ولا يفاجأ 
الباحثون إذا لم يعثروا على أي شيء وثيق الصلة باستفساراتهم» عند إجراء عمليات 
الببحث» بل إنهم قد يسعدوا عندما يعرفوا أن لا شيء قد نشر بعد في الموضوع. 
ويسمى هذا الضرب من عمليات البحث بالبحث السلبي (Stielow & Tibbo,‏ 
)1998 أو كما عبر عنه كل )2000( ail Koll‏ ”التأكد من أن لا إبر في كومة التبن“. 
وينبغي للبحث السلبي أن يكون شاملاً وضافياًء حتى يكون المستفيد النهائي واثقا من 
أنه لست عاك و ثائق jas‏ باهتامه أو يمكن أن تلبي حاجته". l‏ 


(#) يلجأ المستفيد للبحث في الإنتاج الفكري عندما تتجاوز حاجته مجرد التحقق من وثيقة معينة. 
وللبحث في الإنتاج الفكري مساران؛ مسار راجع للتحقق من رصيد الإنتاج الفكري في جال 
معين» في حدود لغوية وجغرافية وزمنية معينة» ومسار جار لمتابعة ما يستجد من وثائق في 
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ولمواكبة مجريات جبهة البحث» أو لأسباب أخرى مناظرة» برص المرء على 
اكتشاف ما هو جديد في calle‏ وذلك بالبحث في الإنتاج الفكري. ويسمى هذا 
الضرب من البحث ESL‏ الانتقائي للمعلومات (بام (SDI‏ وكا Ley‏ في الفصل 
الأول» فقد صمم لون )1961( Luhn‏ طريقة البث الانتقائي للمعلومات» التي 
استخدمت على نطاق واسع» وخصوصاً في الأوساط المالية والعلمية. وبالنسبة 
لعمليات البحث لأغراض البث الانتقائي للمعلومات» يظل الاستفسار كا هوء إلا 
أنه يقدم لنظام استرجاع المعلومات دورياً. كذلك يمكن أيضاً تجهيز عمليات البحث 
للبث الانتقائي للمعلومات آلياً. وقد صور كل (2000) Koll‏ عمليات البحث للبث 
الانتقائي للمعلومات بوصفها ”دعني أعرف كلما ظهرت إبرة جديدة“*. 

ويدل البحث الموضوعي على ضرب آخر من عمليات البحث؛ فالمستفيد 
النهائي يشعر بالحاجة إلى المعلومات» ويود البحث عن بعض النتائج الصاحة. 
ولصياغة استفسار البحث» ينبغي استخدام نقاط الوصول الموضوعية التي أشرنا إليها 
في القسم »١/١/5‏ وتلحق بها الخصائص غير الموضوعية (كاللغة وسنة النشر على 
سبيل المثال). وينبغي وضع تقنيات استرجاع مختلفة في الحسبان للحكم على معدل 
استدعاء وتحقيق عملية البحث. وقد عرض كل )2000( Koll‏ عدة أمثلة للبحث 
الموضوعيء من منظور الاستدعاء والتحقيق عندما صاغ التناظرات التالية: 


(#) يقوم البحث للبث الانتقائي للمعلومات على ثلاثة ركائزء وهي مرصد البيانات» وسات 
المستفيد user profile‏ ومضاهاة سات المستفيد بأحدث قطاع في مرصد البيانات. وجدير 
بالذكر أن البث الانتقائي للمعلومات قد تطور عن الإحاطة الجارية current awareness‏ 
راجع في ذلك: 
حشمت قاسم: خدمات المعلومات» مقوماتها وأشكاها. القاهرة» دار غريب» 19854 . 
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© أي إبرة في كومة التبن: البحث منخفض الاستدعاء ولكنه مرتفع التحقيق. 
gael ©‏ إبرة في كومة التبن: البحث مرتفع التحقيق. 
٠‏ معظم أمضى الإبر في كومة التبن: البحث مرتفع الاستدعاء. 
» جيع الإبر في كومة التبن: البحث في ذروة الاستدعاء. 
وهناك إمكانات أخرى (عمليات بحث منخفضة التحقيق ولكنها مرتفعة 
والتحقيق. وبالمقارنة بأنواع عمليات البحث الأخرى» يبدو البحث الموضوعي EST‏ 
الأنواع تعقداًء وذلك لأن النتائج التي يتم الحصول عليها من البحث. ينبغي تقييمها 
باستخدام المعيارين الجدليين» الاستدعاء والتحقيق. وكا سبق أن ذكرنا فإن الجدل 
حول التحقيق والاستدعاء كمقياسين لأداء الاسترجاع. سوف نتناوله بشىء من 
التركيز في الفصل الحادي عشر ”تقييم تنظيم المعلومات واسترجاعها“. 
ويمثل بحث الفقرات «passage searching‏ الذي ورد بإيجاز في القسم 
١‏ بوصفه استرجاع الفقرات» ضرباً آخر من عمليات البحث؛ إذ لا يتلقى 
المستفيد سوى الفقرة المناسبة فقط من الوثيقةء لا الوثيقة كاملة. ويتم الاعتماد بكثافة 
على مهمة التنقية في بحث الفقرات. وعلى الرغم من أنه لم يظهر إلا في السنوات 
الأخيرة» فإن بحث الفقرات ينطوي على OV sol‏ ضخمة بالنسبة لمساعدة المستفيد 
في الحد من عباء المعلومات الزائدء والارتفاع بمستوى التحقيق في الاسترجاع. 
ويتناول هذا القسم خمسة أنواع مختلفة لعمليات البحث؛ وهي البحث عن 
مواد معروفة» والبحث السلبىء والبث الانتقائى للمعلومات» والبحث الموضوعى» 
وبحث الفقرات. وباتباع معيار آخر للتقسيم الفئوي» صنف بايزا - ييتس وريبرو - 
نتو )1999( Baeza-Yates and Ribeiro-Neto‏ عمليات اليحث إلى نوعين» 
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البحث المخصص أو الموجه ad hoc‏ والتنقية filtering‏ وأيا كانت تسمية نوع عملية 
“oS‏ » فإن الهدف هو تحديد أي أساليب البحث» وأي استراتيجيات البحث ينبغي 
اتباعها لتلبية احتياجات المستفيد. 


استراتيحيات البحث: 
استراتيجيات البحث هى السبل التى يسكلها المرء عند إجراء عمليات 


البحث. وفي المد الذهبى للبحث على LHI‏ المباشر» تحددت معالم الأنواع الأربعة ig‏ 
oye Asta‏ اا SN‏ ث» کا تم توضيحها )1981 .(Fenichel & Hogan,‏ 


طريقة كتل البناء: 

تبدأ طريقة كتل البناء building block‏ بعمليات البحث أحادية المفهوم 
.single-concept‏ والمفاهيم الأحادية ”كتنقية العنكبوتية والجدال'' web filtering‏ 
cand controversy‏ الواردة في الجدول رقم 0/ 01 هي تلك التي أمكن التحقق منها 
في تحليل المفاهيم. وبعد أن تكتمل جميع عمليات بحث المفاهيم الأحادية» يتم الجمع 
بين المجموعات الناتجة bee‏ باستعال المعاملات البولينية الملائمة. 

ويمكن هذه الاستراتيجية أن ME‏ مهمة البحث المركب. إلى مهام أبسط. كما 
أنها تكفل أيضاً للمستفيد إجراء التصويبات أو إدخال التعديلات» كلما دعت الحاجة 
و ری ا إا pach ch dices‏ عل ا اذا بعد ان 
البحث Sls‏ نظراً لحدوث خطأ مطبعي بسيط أثناء إدخال صيغة البحث. ومن ثم 
Of‏ نبج كتل البناء يخفض الضغط على المستفيد» الذي يمكنه حينئذ التركيز أكثر على 
التفاعل مع النظام. ولهذه الأسباب يوصى ببذه الاستراتيجية بقوة لدى المستفيدين» 
Le pasts‏ المبتدئين منهم. 
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طريقة الكرة الحليدية: 

وتعنى طريقة الكرة الجليدية snowballing‏ التى تعرف Laf‏ بطريقة زراعة 
اللؤلق «(Fenichel & Hogan, 1981) Citation pearl - growing ak‏ 
أن نتائج البحث [Solo‏ على نحو يشبه Les‏ ناتج دحرجة الكرة الجليدية في الثلج. 
وما لا شك cad‏ أن هذه الطريقة تبدف إلى الارتفاع بمستوى الاستدعاء. فباتباع هذه 
الاستراتيجية يجري المستفيد أولاً عملية البحثء ثم يعدل استفسار البحثء بناء على 
التتائج المسترجعة.وتنطوي عملية التعديل على النظر في النتائج؛ واختيار 
المصطلحات الصالحة (ككلمات العنوان والمواصفات مثلاً) ثم تضمينها في النص . 
المتقح للاستفسار. ومن الممكن تكرار هذه العملية إلى أن يصبح المستفيد راضياً عن 
نتائج البحث LE‏ 

فإذا ما استرجع بحث عن ”الكتاب الإلكتروني“ electronic book‏ على 
سبيل JE‏ وثائق تشتمل على مصطلحات مثل ستيفن كنج والكتاب الإلكتروني 
ails (Stephen King and ebook‏ يمكن للمستفيد أن يتبع طريقة كرة الجليد. 
بتضمين هذين المصطلحين في صيغة البحث المنقحة» من أجل توسعة نتائج البحث. 
ونحن نعلم أن ستيفن كنج هو أول مؤلف شهير ينشر sy AS)‏ وأن ebook‏ شكل 
مختصر من electronic book‏ وطريقة كرة الجليد في جوهرهاء تماثلة لأسلوب 
الاسترجاع المتطور. وهو توسعة الاستفسارات» الذي تناولناه في القسم 1/1/1 
وقد أطلق كورفاج (1997) Korfhage‏ على هذه الطريقة اسم تجهيز الاقتباس 
„citation processing‏ وكا تبين Od‏ فإن طريقة الكرة الجليدية هذه مفيدة على 
وجه الخصوصء عندما تكون لدى المستفيد الرغبة في التحقق من المصطلحات 
المتصلة» من أجل توسعة عملية البحث. 


(#) مؤلف روائي أمريكي» ألف خسين رواية» فضلاً عن ثماني مجموعات قصصية» ويلغ إجمالى توزيع 
كتبه أكثر من ۳٠١‏ مليون نسخة. وتحول بعضها إلى أفلام سينائية ومسلسلات تلفزيونية. (المترجم) 
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طريقة التحزىء المتتابع: 

تبدو طريقة التجزىء المتتابع successive fraction‏ عكس طريقة الكرة 
الجليدية؛ فعندما يبدأ البحث بمفهوم عريض. تتكفل طريقة البحث بالتجزىء المتتابع 
بتضييق البحث باستخدام مختلف أساليب التقييد أو التحديد. ويستخدم أحد أنواع 
التحديد المعاملات البولينية ومعامل التقارب» عند صياغة عبارة البحث. وكما سبق 
أن بيناء فإن معامل ”في) عدا“ NOT‏ يضيق البحث باستبعاد مصطلحات معينة. 
ويحقق المعامل GALI AND‏ نفسه بإضافة المزيد من الشروط في البحث. كذلك 
يضيق المعامل ”مع“ 3 البحث بتحديد مواضع الكلات في استفسار البحث. 
ومن الممكن تحقيق ضرب آخر من التضييق باستعمال خواص غير موضوعية كاللغة» 
ونوع الوثيقة» وسنة النشر. ويبدو التضييق بمثل هذه الخواص غير الموضوعية أبسط 
وأيسر من التضييق بالمعاملات. 

لنفترض أنه قد تم إجراء بحث عن ”التنقية“ filtering‏ وكانت النتائج 
تشمل كل شيء حول التنقية» حظى بالتغطية في نظام استرجاع المعلومات. فإذا كان 
هدفنا هو البحث عن معلومات حول تنقية العنكبوتية العالمية بوصفها جدالاًء وليس 
بوصفها من تقنيات المعلومات» فإننا يمكن أن نتبع طريقة التجزىء المتتابع لتحقيق 
هدفنا؛ إذ يمكن على سبيل المثال» إضافة المصطلح ”العنكبوتية العالمية“ Á sf web‏ 
إلى صيغة البحث باستعمال المعامل ”و“ AND‏ ومن الممكن إضافة مصطلح 
controversy “Uist!”‏ بالطريقة نفسها. ومن الممكن بعد ذلك استخدام معامل 
”في عدا“ NOT‏ وذلك لاستبعاد أي نتائج تشتمل على مصطلح ”تقنيات 
information technology “ol: pall‏ ومن الممكن تحقيق المزيد من التضييق» 
بقصر البحث على BES‏ التي نشرت قبل عام ۱۹۹١‏ على سبيل المثال. 
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وكا بيناء Of‏ طريقة التجزىء المتتابع الت فر عدا باستعال أساليت 
التحديد المتاحة في نظام استرجاع المعلومات. وتشترط استراتيجية البحث هذه أن 
يكون المستفيد متآلفاً مع مقومات التحديد المتوافرة في النظام» وأن يحافظ على تفاعله 
مع النظام أثناء البحث. وإذا ما وقع الاختيار على استراتيجية التجزىء المتتابع» فإنه 
يمكن للتكلفة أن تكون مهمة: بالنسبة للمستفيد من نظم استرجاع المعلومات على 
الخط المباشر ely)‏ جع القسم )١ [A‏ نظراً لأن هذه الاستراتيجية تتطلب وقت تجهيز 
أطول ما تتطلبه استراتيجيات البحث الأخرى. والواة قع أن نظم استرجاع الإنترنت 
(راجع القسم ۸/ 4) لا تفرض رسوماً على المستفيد, إلا أن مقومات التضبيق التي 
توفرها مثل هذه النظم» لا تزال غير ملائمة إلى حد بعيد. 
الأولوية لأكثر الأوجه تحديدا: 

تطبق طريقة الأولوية لأكثر الأوجه تحديداً most specific facet first‏ على 
عمليات البحث متعددة الأوجه أو المفاهيم )1981 .(Fenichell & Hogan,‏ 
وتفترض هذه الطريقة أن يكون المستفيد على دراية بجميع الأوجه. أو مجموعات 
المفاهيم التي تتضمنها عملية البحث» كا أن باستطاعته أيضاً التحقق من أكثر المفاهيم 
تحديداً. ويمكن لاستراتيجية البحث هذه أن تكون عالية الكفاءة؛ نظراً لأما تبدأ 
عملية البحث بمصطلح يمكن أن يستغرق البحث عنه أقل قدر من الوقت. وفضلاً 
عن ذلك لا يكون هنأك مبرر لمواصلة البحثء إذا كان عدد النتائج المسترجعة بالنسبة 
لأكثر الأوجه laud‏ لا يمكن قبوله؛ فهناك على سبيل SLM‏ ثلاثة أوجه في عبارة 
”علاج الأورام الهرمونية العصبية في الرئة والتنبؤ treatment and “Le‏ 
«prognosis of neuroendocrine tumors in the lung.‏ وهي 'العلاج 
والتنبق“» و ”الأورام الحرمونية العصبية“» و ”الرئة“. ومن بين هذه الأوجه الثلاثة 
تبدو ”الأورام ال هرمونية العصبية“ هي الوجه الأكثر تحديداء وبذلك يتم البحث عنه 
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أولاً في هذه الطريقة. وإذا ما استرجع البحث عن ”الأورام الهرمونية العصبية“ 
وثيقتين فقطء فإنه لا fart‏ للبحث الذي يشمل الأوجه الثلاثة أن يسفر عن ELS‏ 
أكثر من الوثيقتين اللتين أمكن العثور legate‏ فعلاً. 

وفضلاً عن كفاءتهاء يبدو تطبيق هذه الطريقة متطوراً جداً. فلا كان تحليل 
المفاهيم وحده مهمة شاقةء فإنه يصبح من المستحيل تقريباًء بالنسبة لمستفيد مبتدئ 
التحقق من أكثر الأوجه تحديداً» في طلب للبحث متعدد الأوجه. ومن ثم فإن طريقة 
الأولوية لأكثر الأوجه تحديداً لا يوصى بها بالنسبة للمبتدئين. 

ويسمى أحد امتدادات طريقة الأولوية لأكثر الأوجه تحديداً» بطريقة الأولوية 
لثاني أكثر الأوجه تحديداًء التي تتعامل مع الوجه الذي يأتي تاليا من حيث التحديد» 
لإجراء عمليات البحث. إلا أن Uf‏ من الطريقتين لا تستعمل.غالباً في أوساط 
استرجاع المعلومات. وطريقة الأولوية لأقل الأوجه تردداء التي تحظى با لمعا جة في 
Fenichel and Hogan (1981)‏ ببساطة» شكل مختلف من طريقة الأولوية PSY‏ 
الأوجه تحديداً؛ إذ إن أكثر الأوجه تحديدا عادة ما يسفر عن أقل الأوجه ترددا". 


في الطريق إلى طريقة سريعة وكفء: 

كا Load‏ في بداية هذا القسم» فإن كل ما تناولنا من استراتيجيات عمليات 
البحث قد اقترح وتطور في سياق ذروة البحث على الخط المباشر. فقد تغيرت بيئة 
الاسترجاع (كظهور نظم استرجاع الإنترنت على سبيل المثال) كا تغير من يقومون 
بالبحث أنفسهم (المستفيدون كباحثين دون مساعدة الوسطاء على سبيل المثال)» تغيرا 


(#) واقع الأمر أن النظم الإلكترونية لاسترجاع المعلومات» وخاصة تلك التي تعمل على LAN‏ 
المباشرء تبدأ عملية البحث والمضاهاة بأقل الأوجه تردداء OY‏ مجموع ما يحتمل استرجاعه من 
وثائقء لا يزيد بحال عن عدد تلك الوثائق المرتبطة بذلك الوجه. (المترجم) 
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جوهريا منذ ذلك الوقت. lees‏ لا تزال كل من طريقة كتل البناء وطريقة الكرة 
الجليدية» فما الأفضلية من جانب بعض المستفيدين» فإن كثيرين يكتفون بمجرد 
طباعة كلمة مفتاحية واحدة يودون البحث بناء عليهاء أو يدخلون عدة مصطلحات 
دفعة واحدة؛ تاركين مسافات بينهاء ونادراً ما يفيدون من المعاملات البولينية وغيرها 
من مقومات البحث (Jansen, Spink & Saracevic, 2000; Siegfried,‏ 
Bates, & Wilde, 1993; Wallace, 1993)‏ على سبيل المثال. ومن الممكن تسمية 
هذه الطريقة بالطريقة السريعة الكفء. ويمكن لقليل من يقومون بإجراء عمليات 
البحث اليوم» تجربة طريقة التجزىء المتتابع» أو طريقة البدء بأكثر الأوجه تحديداً. ومن 
ناحية أخرى» تدخل OW‏ بعض مقومات أو وسائل البحث US)‏ والمعاملات 
البولينية على سبيل المثال) في واجهات التعامل مع نظم استرجاع المعلومات. وبإمكان 
المستفيد ببساطة» اللجوء إلى هذه الخيارات من أشكال عمليات البحث. والأزرار 
المحددة سلفا أو قوائم الخيارات ال منسدلة» دون طباعتها فعلاً في عبارات البحث. 


الاسترجاع بالتصفح: 

التصفح browsing‏ شك pl‏ رئيس لنشاط الاسترجاع. وبالمقارنة بالبحث» 
فإن التصفح لم يحظ بكثير من الاهتام في أوساط استرجاع المعلومات حتى تسعينيات 
القرن العشرين. ونتيجة لتطور نظم الأسطوانات المكتنزة (CD-ROM‏ ونظم 
الفهارس المتاحة للجمهور على ا لخط المباشر OPAC‏ والعنكبوتية العالمية فائقة 
التنظيم على وجه الخصوص» حظي التصفح بالذيوع بسرعة» وأصبح مجديا من 
الناحية الاقتصادية في استرجاع المعلومات» عندما لم يعد المستفيد بحاجة OF‏ يتحمل 
عبء رسوم الاتصالات» كا في حالة النظم التجارية لاسترجاع المعلومات على الخط 
المباشر؛ فبإمكان المستفيدين اليوم استرجاع المعلومات بالتصفح كا يحلو هم. 
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ما التصفح؟ 
ذلك من الأنشطة. وفي استرجاع المعلومات يتجه المرء نحو التصفح: 
٠‏ للحصول على المعلومات عندما لا يكون ا موضوع محدداً بوضوح 
٠‏ للعثور على المعلومات التى يصعب تحديدها صراحة 
° لإلقاء نظرة عامة على المعلومات التي يوفرها نظام استرجاع المعلومات 
٠‏ لاختيار المعلومات المناسبة من خليط من المواد الصالحة وغير الصالحة 
٠ه‏ لاكتشاف المعلومات الجديدة واستيعابها 
o‏ عندما تحث ty‏ استرجاع المعلومات على التصفح 
ويمكن الاطلاع على أسباب إضافية للتصفح في )1995( Marchionini‏ 
بالإضافة إلى معالجات ضافية. dy‏ حالات من قبيل ”الإبر وأكوام التبن أيا كانت“ 
(Koll (2000)‏ يمكن للتصفح أن يكون طريقة استرجاع مفضلة. 
وعند التصفح لا يكون المستفيد بحاجة لأن يعبر عن مشكلة الاسترجاع 
بمصطلحات محددة» |S‏ يشترط في عملية البحث. وعلى هذا النحو فإن التصفح 
يتطلب جهداً فكرياً أقل ما يتطلبه البحث. إلا أنه بينا يقوم بالتصفحء فإن المرء ينبغي 
أن يظل متفاعلاً مع نظام استرجاع المعلومات» من أجل أن يفحص ويقيم المعلومات 
التي يتصفحهاء ويصدر حينئذ أحكام الصلاحية )1995 -(Marchionini,‏ ؤمن ثم 
فإن العبء المعرفي الملقى على عاتق المستفيد في التصفح ST‏ نما هو عليه إذا ما اختار 
البحث ag‏ للاسترجاع. 


وعلى عكس البحث» OF‏ التصفح يمكن أن يتم كطريقة للاسترجاع دون أي 
تدريب أو تمرس. وکا ذهب مارشيونينى )1995( تصتصمتطء2/9 فإن: 
[التصفح] طبيعي لأنه يربط بين الموارد البشرية العضلية 
والانفعالية والمعرفية» بالطريقة نفسهاء التي يراقب بها البشر العام 
الفيزيائى ويبحثون عن أشياء مادية. )100 (P.‏ 
وبإمكان المرء.أن يتصفح ما دام قادراً على التنفس. إلا أن هناك أساليب قليلة 
تطورت على النحو المناسب» لتيسير عملية التصفح. وفي متناول المستفيد بوجه عام 
توجيهات أو إرشادات قليلة» يمكن الاعتماد عليهاء حول متى يواصل التصفح من 
أجل المزيد من المعلومات» ومتى يتوقف عن التصفح. | 
ويمكن للتصفح» من ناحية أخرى, أن يكون نشاطاً مجزياً؛ إذ يمكن أن يفضي 
إلى المصادفة» أي العثور على شيء مفيد على نحو غير متوقع» نظراً OV‏ التصفح يكفل 
للمستفيد البحث عن المعلومات عشوائياً وعلى نحو غير منظم. والاسترجاع 
بالتصفح طريقة ها مظاهر قوتها ومواطن ضعفها أيضاً. 
أنواع التصفح: 
على عكس البحث» فإن التصفح لا يبدو طريقة استرجاع منظمة. إلا أن هناك 


أنواعاً ختلفة من التصفح» أمكن التحقق منها ومعالجتها في الإنقاج الفكري 
Herner, 1970; Kowalski, 1997; Marchionini, 1995)‏ على سبيل (JON‏ 


ويرى هيرنر )1970( Herner‏ أن التصفح يمكن أن يكون موجهاً» أو شبه موجه؛ أو 
غير car ye‏ وذلك بالتحقق مما إذا كان المستفيد يلتمس كياناً dane‏ وتبعاً لإجراءات 
التصفح المتبعة. كذلك يصنف مارشيونيني )1995( Marchionini‏ التصفح إلى 
ثلاث فئات؛ تصفح نسقي» وتصفح استكشاني» وتصفح عرضي. 
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ويتم التصفح النسقي أو الموجه عندما يكون المستفيد على دراية با يبحث عنه 
بوضوح» كصفحة عنكبوتية بعينهاء في أحد مواقع العنكبوتية العالمية» أو مصطلح 
محدد في معجم مصطلحات على الخط المباشر. أما المستفيدون الذين يمارسون التصفح 
شبه اموجه أو الاستكشافيء فأهدافهم بالنسبة للاسترجاع أقل تحديداًء أو أقل 
وضوحاً؛ فهم يقرؤون بسرعة أو يتفحصون للعثور على ما يسعون وراءه أو 
يلتمسونه؛ فمن الممكن» على سبيل SUM‏ أن يكون المستفيد على دراية OL‏ هناك فكرة 
مهمة قد نوقشت في تقرير مطول. وحينئذ يكون على المستفيد تصفح التقرير للعثور 
على الجزء المناسب منه. ويحقق التصفح غير الموجه أو التصفح العرضي أدنى درجات- 
القابلية للتنبؤ من بين الأنواع الثلاثة للتصفح؛ فبدون حاجة بعينها إلى المعلومات؛ 
يتصفح المستفيد في نظام استرجاع المعلومات. ويمكن لأحد الأمثلة أن يكون تنقل 
المستفيد بسرعة من مادة إخبارية إلى أخرى, أثناء تصفحه لإحدى الصحف المعتمدة 
على العنكبوتية العالمية» على أمل العثور على شيء مهم للاطلاع عليه. 
ولدرس التصفح من منظور مختلف. استقصى كوالسكي )1997( Kowalski‏ 
كيف يتصفح المستفيدون ما يحصلون عليه من نتائج البحث: 
.١‏ التصفح بالترتيب الطبقي ‘ranking‏ فنظراً oY‏ نتائج 
البحث في بيئة الاسترجاع الرقمية» عادة ما تقدم بترتيب 
طبقي» بناء على خوارزميات ترتيب طبقي معينة» يمكن 
للمستفيدين أن يختاروا على سبيل المشال» تصفح النتائج 
التي تحتل طبقة مرتفعة من حيث الصلاحية. 
Y‏ التصفح بالمكان؛ ويدل المكان هنا على الحقول التي عادة 
ما تحدد معالمهاء كحقل العنوان أو حقل المستخلص. ٠‏ 
والعناوين والمستخلصات بعض أمثلة مناطق المحتوى 
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oY‏ التصفح بالنطاق المسلط عليه الضوء؛ فبعض نظم 
استرجاع المعلومات تسلط الضوء على مصطلحات 
معينة (كمصطلحات البحث مثلاً) وسياقاتها» لمساعدة 
المستفيدين في العثور على ما يبحثون عنه» من أجل تحقيق 
الكفاءة. وتلك النطاقات التي تسلط عليها الأضواء 
مرشحة بشكل مناسب للتصفح. 
وفضلاً عن أنواع التصفح التي تناولها كوالسكي Kowalski‏ هناك نوعبان 
آخران للتصفح أصبحت لما السيادة في نظم استرجاع الإنترنت؛ (A gh‏ التصفح بالفئة 
والآخر التصفح بالروابط الفائقة. ويتمثل التصفح بالفئة في نظم استرجاع الإنترنت 
القائمة على الدليل (مثل ياهو!). ويتم تكشيف المعلومات التي تجمعها مثل هذه النظم 
الخاصة باسترجاع الإنترنت» وتصنف في فئات (كالحاسبات» والتعليم» والترويح» 
والرياضة على سبيل المثال)؛ فالمستفيد الذي ينتوي العثور على فيلم سينمائي لمشاهدته 
على سبيل المثال» يمكن أن يكون من الطبيعي أن يتصفح فئة الترويح في ياهو!. أما عن 
التصفح بالروابط الفائقة» فإن العنكبوتية العالمية ببنيانها الفائق» لا تجعل هذا الضرب 
من التصفح مجدياً فحسب» وإنا مغرياً إلى حد بعيد أيضاً. 
والروابط الفائقة هي النقاط الارتكازية modes‏ والمؤشرات pointers‏ الكامنة 
في النصوص الفائقةء التي تحاكي التفكير الترابطي associative‏ للإنسان. (Sb‏ شار 
بوش )1945( Bush‏ فإن: | 


العقل البشري يعمل بالربط أو التداعى tassociation‏ إذيادة ما 
تحت سيطرته يقل بسرعة فورا إلى المادة التالية التى يوحى بها تداعى 
الأفكارء وفقاً لشبكة معقدة من المسارات بخلايا الدماغ )106 AP.‏ 
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وقد انعكس هذا الضرب من الترابط أو التداعي» على نحو واضح وشامل» 
على العتكبوتية العالمية بتطبيق الروابط الفائقة. فالعنكبوتية العالمية برمتهاء تتكون من 
معلومات نصية» وكذلك معلومات متعددة الوسائط» متشابكة بعدد لا حصر له من 
الروابط الفائقة. وتلك الروابط بمثابة أدلة بالنسبة للمستفيدين من العنكبوتية CALL‏ 
للتصفح. والملاحة» والعثور على المعلومات الرقمية )1997 (Chu,‏ ومن شأن نظم 
استرجاع المعلومات فائقة البناء» أن تصبح واحدة من أفضل البيئات: إن لم تكن 
الأفضل بالنسبة للتصفح. ٠‏ 
استراتيجيات التصفح: 

يمكن للتصفح» كالبحث» أن يتبع استراتيجيات مختلفة. وقد ذكر مارشيونيني 
Marchionini‏ أن هناك ار بع استراتيجيات للتصفح» وهي التفحص (Scan‏ 
والملاحظة observe‏ والملاحة «navigate‏ والرصد monitor‏ ويمكن لاختيار 
استراتيجية التصفح المناسبة أن يساعد المرء على تحقيق أهداف التصفح على نحو 
أكثر فاعلية. 

وكيا ذهب مارشيونيني )1995( Marchionini‏ فإن التفحص استراتيجية 
تصفح من أجل التماس الأشياء محددة المعالم جيداً» في بيئة استرجاع معلومات فائقة 
التنظيم؛ يكون المستفيد على دراية با يبحث care‏ وبإمكانه تفحص المعلومات طوليا 
أو انتقائياً. ولكي يتصفح طولياً فإنه يتصفح في فضاء المعلومات تتابعياً» وكأنه يمر 
على قائمة النتائج المسترجعة واحدة تلو أخرى. ويعني التفحص الانتقائي النظر فقط 
في قطاعات معينة من المعلومات (كالمداخل أو العناوين» والروابط الفائقة» والصورء 
والمحتويات ذات OL JY‏ المختلفة في موقع العنكبوتية» على سبيل (SLU‏ وذلك من 
بين تلك المحتويات التي يعرضها الموقع. ويبدو التفحص أهم استراتيجية أساس 
بالنسبة للتصفح النسقي. 
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أما الملاحظة؛ في مقابل ذلك» فهي الاستراتيجية الأساس التي تستخدم في 
التصفح الاستكشافي أو العرضي )1995 (Marchionini,‏ وينبغي أن يكون المستفيد 
منتبها لقطاعات معينة ما تتم ملاحظته» في الوقت نفسه الذي يمكن فيه للمكونات 
الأخرى لبيئة استرجاع المعلومات (كالإعلانات على مواقع العنكبوتية مثلاً) أن 
تصرف انتباه المرء ٠‏ وبعبارة أخرى» فإن مدخلات مختلفة الأنواع» يتم إرساها إلى 
المستفيد من مصادر مختلفة ة. وعلى المستفيد أن يحتفظ بتركيزه على ما هو بصدد التأسه» 
ويتجاهل الشوشرة.والملهيات الأخرى. 

وتوازن الملاحة» كاستراتيجية تصفح» بين تأثير المستفيد والبيئة؛ إذ تقيد البيئة 
التصفح بتوفير مسارات التصفح المحتملة؛ بين يارس المستفيد Leg‏ من التحكم 
باختيار أي المسارات يمكن أن يسلك )1995 SULS.(Marchionini,‏ يمكن 
للملاحة» بناء على التلقيم المرتد لنظام استرجاع المعلومات» أن تستخدم على نحو أكثر 
من التصفح النسقي أو التصفح العرضي. وغالبا ما تستخدم الملاحظة مرتبطة 
بالملاحة. والرصد أو المراقبة le‏ للتفحص (ob‏ عدا تحمله للبيئات سيئة التنظيم 
-(Marchionini, 1995)‏ وبين) ينظر المستفيدون في النتائج التي يسترجعها النظام» 
على سبيل المثال» يمكنهم أيضاً أن يولوا بعض الانتباه للتقارير الإخبارية التي يتم بثها 
عبر المذياع. وتتم أنشطة التعاس المعلومات متوازية؛ فالرصد أو المراقبة يستخدم في 
الغالب الأعم مع التصفح الاستكشافي. 

وقصارى القول» فإن استراتيجيات التصفح تبدو أكثر غموضاً من 
استراتيجيات البحث التي سبق تناؤها؛ فليست هناك معايير محددة يمكن أن تساعد 
المستفيد في تحديد ما إذا كان التصفح ينبغي أن يتواصل أم يتوقف. وليست هناك 
توجيهات أو إرشادات يمكن للمستفيد اتباعها فيا يتعلق بتغيير استراتيجيات 
التصفح. وعوضاً عن ذلك فإنه يتعين على المستفيد النظر في عدد من العوامل الكيفية 
(كالرضا أو الاكتفاء والجهد Gall‏ على سبيل المثال) لأغراض اتخاذ القرار. كما أنه 
ليس هناك أيضاً خط واضح فيا يتعلق بمتى يختار أي استراتيجية» وفي ظل أي 
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ظروف. فهل يمكن للتصفح كنهج للاسترجاع» أن يعمل على نحو أفضل عندما 
يستخدم مرتبطاً بالبحث» بدلا من استخدامه منفرداً؟ ويحاول القسم التالي الإجابة 
عن هذا السؤال. 


تكامل البحث والتصفح في الاسترجاع: 
البحث والتصفح نهجان متميزان للاسترجاع؛ فمنذ حوالي نصف قرن تقريباً» 
قسم لون )1958( Luhn‏ طرق الاسترجاع إلى: 
.١‏ استرجاع المعلومات بالنظر في سلسلة مرتبة من التسجيلات 
المختزنة. 
التسجيلات المختزنة. 
Y‏ الجمع بين الطريقتين الأولى والثانية. 
ولقد تغيرت مصطلحات وبنية مراصد بيانات النظم» ولا شك عبر السنين» 
إلا أنه لا يزال من الممكن أن نرى أن الفئة الأولى التي تناو ها لون تمثل التصفح» بينا 
تدل الثانية على البحث. أما الضرب الثالث فهو الموضوع الذي نحن بصدد 
استکشافه» وهو تكامل التصفح والبحث. 
المقارنة بين نهجي الاسترجاع: 
لقد تناولنا بالوصف خصائص كل من التصفح والبحث في الأقسام السابقة. 
وكا ذهب كوكس )1992( Cox‏ فإنه من الممكن النظر إلى التصفح بوصفه الانتقال 
من أين إلى ماذا. والفكرة وما فيها أن المستفيد يعرف مكانه في مرصد البيانات» ويود 
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أن يعرف ما هو متاح هناك. وفي مقابل ذلك» يمكن النظر إلى البحث بوصفه الانتقال 
من ماذا إلى أين. والفكرة وما فيها أن المستفيد يعرف ما يرغب فيه» ويود معرفة أين 
يتاح في مرصد البيانات. وقد صرح مارشيونيني )1995( ol Marchionini‏ البحث 
هو الاستراتيجية الرسمية والتحليلية» بين| التصفح هو الاستراتيجية غير الرسمية أو 
الإيعازية -heuristic‏ وبالإضافة إلى تلك الفروق» يختلف البحث والتصفح بعضها 
عن بعض في جوانب التي نعرض ها فيما يل. 
الحاجة إلى المعلومات: 

الخاجة إلى المعلومات أحد المعايير الرئيسة التي تميز بين البحث والتصفح 
كنهجين للاسترجاع. by‏ يتعلق بالحاجة المحددة والمعروفة إلى المعلومات» يبدو 
البحث هو الخيار المناسب» إذ يمكن أن يساعد المستفيد فى العثور على ”الإبرة“ في 
”كومة التبن“ بكفاءة. وني مقابل ذلك يمكن للتصفح أن يستخم لإنجاز مهام 
استرجاع. لمستفيدين لدم احتياجات معلوماتية عريضة وغير واضحة المعالم. 
ويمكن للمرء اتباع إجراءات التصفح (كالتفحص أو الملاحة على سبيل (SA‏ 
لمعرفة ما إذا كانت هناك أي معلومات في نظام استرجاع المعلومات» مناسبة 
لاحتياجاته المعلوماتية. 
الكفاءة واحتمالات التحسن: 

ينبغي وضع الكفاءة في الاسترجاعء واحتتالات التحسن. في ا لحسبان عند 
مقارنة البحث بالتصفح. ويمكن القول بوجه عام» أن البحث سريع» ومركز» ويدخل 
فى الصميم» Ee‏ التصفح يمكن أن يكون مستنفذاً للوقت» ولا يقصد به أن يكون 
نشاطاً مركزاً. كذلك يبدو أن المستفيد يمكن أن يكون هناك ما يصرف انتباهه في 
التصفح. وبين تتاح للمستفيد أساليب متعددة لتوسعة البحث أو تضييقه» لا تتوافر 
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للتصفح سوى إمكانيات ضئيلة للمساعدة على الارتفاع بمستوى الأداء. وفضلاً عن 
ذلك فإنه لا يمكن للمستفيد الحصول على المعلومات» إلا من تلك القطاعات التي 
يتصفحها في النظام. ومن الممكن نظرياً للتصفح أن يتواصل» مالم يضع المستفيد نهاية 

له. وفي الوقت نفسه. يمكن لدقة التصفح أن 5 تتراجع في مشل هذه العملية المطولة 
.(Marchionini, 1995)‏ 


العبء المعرفي: 
من الممكن تقسيم عملية البحث برمتهاء إلى حوالي ثلاث مراحل؛ التعبير عن 

الاستفسار» وإجراء عملية البحثء ثم تقييم التتائج. ومن الممكن للعبء المع رفي الملقي 
على عاتق المستفيد» أن يكون عالياً في المرحلتين الأولى والثالشة» ومنخفضاً نسبياً إذا ‏ 
يحاول المستفيد أن يكون متفاعلاً أثناء البحث. أما التصفح» في مقابل ذلك فعملية 
تفاعلية بدرجة كبيرة» في جميع المراحل» بين النظام والمستفيد. ويصبح التصفح لا مبرر له 
إذا لم يتفاعل المستفيد مع النظام» ويظل منتبها لما يقدمه النظام. ومن المرهق بالنسبة للمرء 
Jes‏ كرا و ete S‏ يحون طايه اميل Seales‏ 
وسريع» تقييم المعلومات التي يتصفحها وفقاً لمحددات معينة. إلا أن التصفح يعتمد على 
التحقق من المعلومات old‏ الصلةء لا على الاسنتدعاء من الذاكرة & (Large, Tedd‏ 
Hartley, 1999)‏ الأمر الذي يمكن أن يخفف من العبء المعرفي الملقي على 
عاتق المستفيد. 


الصدفة: 
تكاد احتمالات الصدفة في البحث تكون منعدمة 5 تقريباًء نظراً لأن النظام يقوم 


ف الأساس على مضاهاة الاستفسار مقابل ما يشتمل عليه مرصد البيانات. فليس من 
المجدي ولا من المحتمل» بالنسبة للمستفيد أن يتفحص النظام SULS‏ لاستكشاف 
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معلومات إضافية. Gy‏ مقابل ذلك فإن التصفح يفسح المجال للصدفة. وقد لا يعجب 
المستفيد حين يجد شيئاً daga‏ على نحو غير متوقع أثناء التصفح. إلا أن هذه الميزة في 
التصفح يمكن أن تصبح أيضاً وبسهولة» مصدراً لصرف الانتباه أو فقدان LEYI‏ 
وهذا قصور أشار إليه الباحثون» ومن بينهم مارشيونيني )1995( -Marchionini‏ 
الحهود: 

البحث جهد منضبط؛ يتطلب من المرء التدريب والتمرس» حتى يكون قادراً 
على إنجازه. وفي مقابل ذلك» فإن التصفح نهج استرجاع فطري بالنسبة للمستفيد.. 
الذي CLAY‏ لإنفاق وقت في تعلمه. وفضلاً عن ذلك» لا تنطوي عملية التصفح 
على تعبير عن الاستفسارات» الأمر الذي يمكن أن يخفف عن كاهل المستفيد عبء 
تلك المهمة بالغة التعقد» ويكفل له التركيز ببساطة على التصفح. 


ويلخص الجدول رقم ١/١‏ المقارنة بين البحث والتصفح. في حمسة 
جوانب مختلفة. 
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النهج المتكامل: 

يتبين من المقارنة» في الجدول رقم /١‏ ١ء‏ أن لكل من البحث والتصفح مظاهر 
قوته وأوجه قصوره. ويعمل كل نبج للاسترجاع» على نحو مناسب. في ظل شروط 
وظروف معينة. وعلى الرغم من أن هناك مناسبات تبدو فيها إحدى طرق الاسترجاع 
أكثر ملاءمة من غيرهاء فإنه يمكن للتكامل بين النهجين أن يفضي إلى أداء استرجاع 
أفضل بوجه عام. وقد لا تكون هناك حاجة إلى البحث في كل مهمة من 
مهام الاسترجاع» إلا أن التصفح دائ ما يكون ضرورياً في الحكم على صلاحية 
النتائج المسترجعة. 

يضاف إلى ذلك أن نظم استرجاع المعلومات مصممة لتشجيع النهج المتكامل 
في أوساط استرجاع المعلومات. By‏ نظم استرجاع المعلومات التي تطورت في وقت 
مبكر (ديالوج Dialog‏ على سبيل (OEM‏ تتاح قوائم الاختيار وخيارات البحث 
Leal 3‏ بحيث يمكن للمستفيد أن يفاضل بين التصفح والبحث وفقاً للحاجة. أما 
بالنسبة لنظم استرجاع الإنترنتء التي تطورت في Sle‏ تسعينيات القرن العشرين» 
Ob‏ القاعدة هي أن يكون هناك دليلء وتقنية بحث Lee‏ إلى جنب. وعلى خلاف 
الزمن الذي ظهرت فيه نظم استرجاع الإنترنت لأول مرة للجمهوره فإن هذه النظم 
إما أن توفر دليلاً (مثل ياهو!) أو تقنية بحث (مثل ألتافيستا (Altavista‏ وليس 
Legh‏ ولحسن BH‏ فإن كثيراً من نظم استرجاع الإنترنت» سرعان ما أدركت مزايا 
دعم كل من التصفح والبحث في نطاق نظام الاسترجاع الواحد» ومن ثم غيرت من 
ممارساتها القديمة. ولا نكاد اليوم نجد أيا من نظم استرجاع معلومات الإنترنت» 
يوفر خيار استرجاع واحد فقط للمستفيد. 


| ويلجأ المستفيدون للنهج المتكامل» نظراً لأنهم لا تتوافر لهم المقومات المناسبة 
لمهمة الاسترجاع المناسب فحسب» ify‏ يحصلون أيضا على المزيد من النظم نفسها. 
e! gals‏ على سبيل المثال» يدعم البحث في نطاق فتاته القابلة للتصفح (كالفنون Arts‏ 
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على سبيل المثال). ومن ثم» فإن البحث في نطاق فئة قابلة للتصفح» يشبه البحث في 
مرصد البيانات المتخصص في أحد المجالات التي تمثلها الفئة القابلة للتصفح. ويقصد 
بذلك القول أن البحث في ياهو!ء في نطاق فتته الخاصة بالفنون» يشبه عمليات البحث 
في مراصد بيانات الفنون والآداب. ويصبح التصفح والببحث نشاطين متكاملين في 
هذه البيئة. وعلى النحو نفسه. Of‏ نتائج البحث في نظام لاسترجاع المعلومات pea)‏ 
كلاستي" (Clusty‏ تتجمع تلقائيا لتيسير التصفح. 

ويمكن لواحد زائد واحد أن يكون أكثر من اثنين» إذا ما تم تكوين المجموعة 
بحكمة. ويصدق ذلك بالنسبة لنهج الاسترجاع المتكامل الذي نتناوله هنا. 


(4) أحد محركات البحث الفائقة» أو ماوراء حر کات البحث -meta-search engine‏ (المترجم) 
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الفصل السابع 


تماذج استرجاع المعلومات 


يعرّف الأنموذج ail, model‏ ”وصف تقريبي مؤقت لنظرية أو نظام» يفسر 
جميع خصائصه المعروفة“ )1984 (Soukhanoy, et al.,‏ وقد تطورت ناذج ختلفة 
في استرجاع ا معلومات» على مر السنين. ويقدم هذا الفصل ويستكشف بعض النماذج 
المألوفة لاسترجاع المعلوماته من أجل تيسير فهم ممارسسات 
استرجاع المعلومات وتقدير أسسها. 

وهناك مستويات متعددة» يمكن فيها نمذجة استرجاع المعلومات. وتستدعى 
نظريات وأفكار من المجالات التخصصية الأخرى (كالمنطق البوليني» والفضاء 
المتجهي eveetor space‏ والاحتالات على سبيل المثال) لتشكيل أسس نمذجة: 
أنشطة استرجاع المعلومات. وقد اقترحت عدة خطط مختلفة لتصنيف جميع نماذج 
استرجاع المعلومات» التي تم تطويرها حتى Baeza-Yates & Ribeiro-) OV!‏ 
Neto, 1999; Belkin & Croft, 1987; Sparck Jones & Willett, 1997‏ 
على سبيل المثال). وقد توسع إنجورسن وييرفلين Ingwersen and Jarvelin‏ 
)2005( في التقسيم ال رمي لناذج استرجاع المعلومات» الذي طوره بلكن وكروفت 
Belkin and Croft (1987)‏ إلى كل من المضاهاة الدقيقة exact matching‏ 
(انظر الشكل 5/ pails (iy‏ مضاهاة best matching‏ (انظر الشكل رقم /é‏ ۲ب( 
في كتابهم|). ويركز هذا الفصل على النماذج الموجهة للنظم» أو التي تركز على النظم 
«system oriented‏ كالنطق البوليني» والفضاء المتجهيء» والاحتالات. 
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وسوف نتناول الناذج الأخرى لاسترجاع المعلومات (كالأنموذج المعرفي الموجه 
للمستفيد» أو الذي يركز على المستفيد user-oriented‏ على سبيل المشال) في فصول 
أخرى» Le‏ يكون ذلك مناسبا على نحو أكثر التزاما بالمنطق في) يتعلق بالمحتوى 
الموضوعي. 


المضاهاة ليست من ناذج استرجاع المعلومات» وإنما تضع الأساس ET‏ 
لأنشطة استرجاع المعلومات. وكا بينا في القسم /٤ /١‏ ١ء‏ فإن المضاهاة هي التقنية 
الأساس في استرجاع المعلومات؛ فمن الممكن إجراء المضاهاة بين المصطلحاتء أو 
بين مقاييس التشابه كالمسافة وتردد المصطلحات. ويتم إجراء مضاهاة المصطلحات 
مباشرة مقابل المصطلحات المستقاة من الاستفسارات أو الوثائق أو بدائلهاء أو المعينة 
للاستفسارات أو الوثائق أو بدائلهاء بين يتم إجراء مضاهاة مقاييس التشابه على نحو 
غير tls‏ مقابل المقاييس التي يتم الحصول عليها بحساب المسافة بين المتجهات»ء كا 
في أنموذج الفضاء المتجهي على سبيل المثال. ويركز القسمان الفرعيان التاليان على 
مناقشة هذين الضربين من المضاهاة. 
مضاهاة المصطلحات: 

كما بينا في القسم ۲/ /١‏ ١ء‏ فإن المصطلحات التي تستعمل في تنظيم المعلومات 
واسترجاعهاء يمكن أن تكون كلمات مفتاحية» أو واصفات» أو معرفات أو حددات 
للهوية. كذلك تشمل المصطلحات elds‏ أو العبارات» أو الأنواع الأخرى من 
وسائل التعبير. وفضلا عن ذلك يمكن مضاهاة المصطلحات بإحدى الطرق الأربع 
التالية» وهي المضاهاة الدقيقة:؛ والمضاهاة الجزئية؛ والمضاهاة الموضعية» 
ومضاهاة المدى. 
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وتعني المضاهاة الدقيقة أن يضاهي التعبير عن الاستفسارء التعبير عن الوثيقة 
تمام المضاهاة في نظام استرجاع المعلومات. والبحث بمراعاة شكل الحرف الأول؛ 
والبحث بالعبارة» من أمثلة المضاهاة الدقيقة؛ ”فتنقية العنكبو 15“ «web filtering‏ 
على سبيل المثال» مصطلح ورد في استفسار ماء كذلك ترد العبارة نفسها في النظام 
المزمع البحث فيه؛ حينئذ يتم الحصول على المضاهاة الدقيقة نتيجة للبحث. 


Jos‏ عكس المضاهاة الدقيقة قيقة» فإنه في المضاهاة المزئية» يضاهي جزء فقط من 
مصطلح الاستفسار مقابل طريقة ة التعبير عن الوثيقة F‏ في نظام استرجاع المعلومات. 
والبتر في البحث مثال تقليدي للمضاهاة الجزئية؛ فمن الممكن على سبيل SEL‏ لبحث 
استفسار information technology*‏ (حيث النجمة # هي رمز البتر) أن يستر جع 
الوثائق التي تشتمل عل «information technology‏ وڪ information‏ 
information technologists , «technologies‏ نتيجة المضاهاة الحزئية. 

أما المضاهاة الموضعية positional‏ فتتم بوضع المعلومات الموضعية في 
الحسبان» في عملية المضاهاة. والبحث بالتقارب إحدى الحالات الجديرة بالنظر؛ فإذا 
كان استفسار البحث هو cused 1WITH store‏ فإنه يمكن للنتائج المسترجعة أن 
تشمل الوثائق التي تشتمل على عبارات jia‏ متجر الكتب المستعملة“ used book‏ 
«store‏ و ”متجر الملابس المستعملة '' cused clothing store‏ و”متجر الأثاث 
المستعمل cused furniture store“‏ فالمضاهاة بين الاستفسار وطريقة التعبير عن 
الوثائق هناء تتم بالكلمتين الأولى والأخيرة فقطء بين| يتم تجاهل الكلمات الواردة في 
موضع الوسط في عملية المضاهاة. 

ومن الممكن تطبيق مضاهاة المدى grange match‏ وسائل التعبير العددية 
numeric‏ (كحجم المبيعات مثلا)» أو وسائل التعبير بالترتيب الطبيعي (مشل يناير» 
فبراير» ... ديسمبر). فما تتم مضاهاته في مضاهاة المدى» هو الحد الأعلى للمدى 
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(مطبوعات ما قبل عام »)۲٠٠۲‏ أو الحد الأدنى للمدى (مثل مطبوعات ما بعد عام 
۲ ايأو gals‏ (مثل مطبوعات مابين ۱۹۹۳ وا*٠٠۲).‏ ومراصد البيانات 
العددية numeric‏ وتواريخ النشر أمثلة تقليدية للبحث بالمدى. 

وتتعلق هذه الأنواع الأربعة المختلفة لمضاهاة المصطلحات» بالاستفسارات 
الأصلية» وطرق التعبير عن الوثائق» دون أي حسابات أو تحويل. وينظر إلى مضاهاة 
المصطلحات في الغالب الأعم» في أنموذج المنطق البوليني. أما في الناذج الأخرى 
لاسترجاع المعلومات (مثل الفضاء المتجهي والاحتالات) فلاتتم مضاهاة 
المصطلحات الواردة في الاستفسارات» مقابل وسائل التعبير عن الوثائق» على 
نحو مباشرء وإنما يمكن تحويل المصطلحات إلى بعض مقاييس التشابه قبل 


أن تتم مضاهاتها. 
مضاهاة مقاييس التشابه: 


من الممكن لمضاهاة مقاييس التشابه أن تطبق بعدد من الطرق المختلفة؛ ففي 
أنموذج الفضاء المتجهي, على سبيل UL‏ تستند المضاهاة على BLU‏ بين المتجهات 
أو درجة زاوية المتجه؛ وكل) انخفضت زاوية المتجه؛ ارتفعت درجة التشابه 
بين الاستفسارات والوثائق. أما في الأنموذج الاحتالي فإنه من الممكن حساب 
التشابه اعتمادا على تردد المصطلحات» لتحديد OV cel‏ العلاقة الوثيقة بين 
الاستفسارات والوثائق. 

وعند إجراء هذا النوع من المضاهاة» يتعين اختيار مقياس للتشابه خلاف 
المصطلحات نفسها. فبناء على هذه المقاييس تتم المضاهاة في النهاية. ومن ناحية 
أخرى» تكفل مضاهاة مقاييس التشابه طرقا أخرى إضافية لإنجاز مهمة الاسترجاع. 
ويمكن el‏ هذه ال مارسات؛ من ناحية أخرىء أن تؤدي إلى وقوع أخطاء وحدوث 
شوشرة» وخصوصا في عملية الحصول على مقاييس التشابه. 
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وبصرف النظر عن نوعية المضاهاة» فإن المضاهاة هى الأسلوب الأساس في 
استرجاع المعلومات. وتوضح ناذج استرجاع المعلومات» التي تناولناها هنا كيف تتم 
المضاهاة في مختلف الظروف» جنبا إلى جنب مع خصائص الناذج ومزاياها وأوجه 
القصور التي تكتنفها. 


أنموذج المنطق البوليني: 

سمي أنموذج المنطق البوليني باسم جورج بول George Boole‏ الذي اقترح 
المنطق البوليني في منتصف القرن التاسع عشر. ويشمل المنطق البوليني ثلاث عمليات 
منطقية؛ هي الناتج المنطقي s «logical product (x)‏ الملجموع المنطقي logical‏ 
sum (+)‏ والفارق المنطقى (-) logical difference‏ وتستعمل ثلاثة معاملات 
مقابلة» هي ”و“ AND‏ و ”أو“ OR‏ و i”‏ عدا“ (NOT‏ للتعبير عن العمليات 
المنطقية في استرجاع المعلومات. وني الطبعات المبكرة لبعض نظم استرجاع الإنترنت» 
كانت علامة زائد )+( تستعمل للتعبير عن المعامل ”و“ الأمر الذي ربا يكون قد 
امبر let Aaa‏ ا E‏ 

أو“ في المنطق البوليني. 

ويجمع الناتج المنطقي أو المعامل ”و“ بين مصطلحين أو أكثر في صيغة البحث» 
ويشترط وجود جميع المصطلحات في الوثائق المؤهلة للاسترجاع. Ul‏ المجموع المنطقي 
أو المعامل ”أو“ فيربط بين مترادفين أو أكثرء أو مصطلحات متصلة في صيغة البحث. 
ويمكن النظر إلى الوثائق التي تشتمل على أي من المصطلحات الواردة في صيغة 
الببحث» بوصفها ضربات صائبة أو تسديدات hits‏ أو نتائج متوقعة. أماالفارق 
المنطقىء أو المعامل ”فيا عدا “NOT‏ فيحد من عمليات البحث» باستبعاد 
EE‏ التي ترد بعد المعامل ”في] عدا“ في الاستفسارات. وقد وردت أمثلة 
بعينها لاستعمال المعاملات البولينية في القسم 0/ V/V‏ عندما تعرضنا لتقنية 
coed‏ البوليتي: 
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وكا بينا في القتسم ۱ فإن مورتيمر تاوبه Motimer Taube‏ أدخل 
المنطق البوليني إلى استرجاع المعلومات. ومع التطور السريع للنظم الإلكترونية 
لاسترجاع المعلومات» تزايد تبنى واستعبال المنطق البولينى. وعندما انتقلنا إلى العصر 
الرقمي» فإننا قلا نجد من نظم استرجاع المعلومات ما لا يدعم الأنموذج البوليني 
للبحث. وواقع الأمر أن أنموذج المنطق البوليني قد أصبح يطبق على نطاق واسع 
كتقنية لاستر جاع المعلومات )1997 .(Spärck Jones & Willett,‏ إلا أن ذلك لا 
يعني أن المنطق البوليني أنموذج لاسترجاع المعلومات لا يكتنفه قصور. بل العكس» 
إذ يمكن أن نجد مناقشات حول مظاهر القوة ومواطن الضعف في أنموذج المنطق 
البولينىء في كثير من الوثائق ( Chowdhury, 1999; Cooper, 1988; Frants,‏ 
et al., 1999; Korfhage, 1997; Spärck Jones & Wilett, 7‏ على 


سبيل المثال). 
مظاهر قوة أنموذج المنطق البوليني: 

يدل الاستخدام المكنف لأنموذج المنطق البوليني في استرجاع المعلومات» على 
ما هذا الأنموذج oy‏ أهمية؛ فهو أولا يدعم المعالجة البارعة manipulation‏ لمختلف 
الأوجه الناتجة عن تحليل الاستفسارات أو الوثائق. فبإمكان المعامل ”و“ AND‏ 
الجمع بين وجهين بسيطين لتشكيل وجه مركب» وبذلك يضيق من مجال البحث. 
ويكفل المعامل ”أو“ OR‏ تحديد الأوجه البديلة للاستفسار أو الوثيقة» ومن ثم 
توسعة Jle‏ عملية البحث. أما المعامل hd”‏ عدا“ NOT‏ فبإمكانه عزل الأوجه 
المركبة في أوجه مفردة بسيطة» ومن ثم استبعاد الأوجه غير المرغوب فيهاء بحيث لا 
تظهر في نتائج البحث النهائية. ويمكن لمثل هذه ALUM‏ البارعة» إذا ما طبقت على 
النحو السليم» أن تضفي المرونة والفاعلية على استرجاع المعلومات» على مستوى لا 
يمكن لأي ناذج أخرى لاست رجاع المعلومات أن تباريه. 
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ثانياء تبدو نظم استرجاع المعلومات المعتمدة على المنطق البوليني فعالة من 
حيث التكلفة cost-effective‏ ولا غنى عنها Lad‏ بالنسبة للمستفيد (Frants, et‏ 
al, 1999)‏ وهناك الآلاف من نظم استرجاع المعلومات القائمة على المنطق البوليني» 
العاملة فعلا. وبإمكان المستفيد النهائي استعمال المعاملات البولينية لتوسعة مدى 
عملية البحث أو تضييقهاء أو استبعاد نتائج معينة من البحث. وعلى هذا النحو يبدو 
أنموذج المنطق البوليني مستقراء وإن كان بعض الباحثين )1987 Belkin & Kroft,‏ 
على سبيل (JEN‏ يرون أن الأنموذج قد أصبح مستقرا من خلال المارسة أكثر منه من 
خلال النظرية. 

(Spiirck Jones يبدو أنموذج المنطق البوليني مفهوما على نحو مناسب‎ WE 
وإن كانت المناقشات حول ما يمكن للأنموذج أن يحققه أقل‎ «& Willett, 1997) 
يمكن أن يكون‎ pal بكثير من المناقشات حول ما يعجز الأنموذج عن تحقيقه. وهذا‎ 
CONS أن أنموذج المنطق البوليني هو الأقدم من بين كل‎ sl ناتجا عن عاملين؛‎ 
استرجاع المعلومات. ومن المسلم به أن مظاهر قوته تحظى بالتقدير المناسب إلى حد لا‎ 
يدعو للمزيد من التحسن. والعامل الثاني هو أن المنطق البوليني» بوصفه أقدم نماذج‎ 
استرجاع المعلومات» يمكن أن ينتقد كلما ظهر أنموذج جديد لاسترجاع المعلومات.‎ 
ومن الطبيعي للمرء أن يعلن أن أنموذجا جديدا لاسترجاع المعلومات» قد صمم‎ 
للتغلب على أوجه قصور الأنموذج القديم. ويمكن لمصمم النظام» شأنه شأن‎ 
المستفيد» أن يفضل العمل بأنموذج مفهوم بم فيه الكفاية.‎ 

رابعاء أن نظم استرجاع المعلومات القائمة على المنطق البوليني» سهلة نسبيا في 
بنائهاء نظرا OY‏ الخوارزميات التي ينطوي عليها التصميم» تبدو أكثر بساطة في 
تطبيقها من تلك التي تقوم على ناذج أخرى لاسترجاع المعلومات. ويمكن لذلك أن 
يسهم جزئيا أيضا في اتساع نطاق تطبيق النظم البولينية لاسترجاع المعلومات. ونظرا 
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palal‏ القوة التي سبق ذكرها (كأسلوب المعالجة البارعة» والاستخدام على نطاق 
واسع على سبيل (JEU‏ فإن أنموذج المنطق البوليني دائ ما يحظى بقدر كبير من 
الاهتمام [E>‏ تكون نماذج استرجاع المعلومات موضوعا للتدقيق التحليلي. 
أوجه قصور أنموذج المنطق البوليني: 

حظيت أوجه قصور أنموذج المنطق البوليني» كما سبق أن بيناء بالدرس 
والاستكشاف على نحو ضاف في كثير من الوثائق ( ;1999 Chowdhury,‏ 
Cooper, 1988; Frants, et al., 1999; Korfhage, 1997; Sparck Jones‏ 
Willett, 1997‏ & على سبيل المثال) . والمناقشة التالية هي خلاصة أوجه قصور 
ذلك الأنموذج. 

أولاء من الصعب على المستفيد إجراء عمليات البحث البوليني بدون درجة 
مناسبة من التمرين والتمرس. وتكمن الصعوبة في جانبين: ON)‏ من الصعب بالنسبة 
للمستفيد اختيار المعامل البوليني المناسب؛ فدائم) ما يكون هناك خلط بشأن المعاملين 
”و“ AND‏ و ”أو“ OR‏ في أوساط المستفيدين» نظرا OY‏ لماتين الكلمتين معانٍ 
مختلفة في المغزى التقليدي أو الدلالة المشتركة؛ فكلمة and‏ تعني تقليديا زائد plus‏ 
كما في ”إنهم سيبحثون عن هذا الموضوع في ألتافيستا “AltaVista‏ و”جوجل 
«Google‏ على سبيل المثال» بين| تعني كلمة LÝ or‏ من seither one‏ كما في 
”سيبحثون عن هذا الموضوع في ألتافيستا“ أو flee gan”‏ على سبيل JUN‏ ومن 
الممكن نظريا البحث في مواقع في ال حالة الأولى» أكثر Le‏ يحدث في الحالة الأخيرة. 
وعادة ما يفكر بعض المستفيدين be‏ النحو نفسه» عندما يصوغون الاستفسارات 
البولينية» أي ol‏ يستعملون المعامل AND‏ عندما يكونوا راغبين في الحصول على 
نتائج كثيرة» ويستعملون المعامل Or‏ عندما يكونوا راغبين في نتائج قليلة. وتما لا شك 
فيه أن المنطق البوليني لا يعمل على هذا النحو. ومن المحتمل لهذا الفارق أن يؤدي إلى 
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اختيار المستفيد للمعاملات غير المناسنبة» أي يستعمل المعاملين GOR; AND‏ 
السياقات غير المناسبة. (Y)‏ من الصعب بالنسبة للمستفيد أن يتبع تسلسل المعالجة على 
LSM gb Sollee digs you‏ ركع Gta‏ الق 
0/ 1/ 1/1 فإن عمليات البحث البوليني المركبة تنطوي على أكثر من ضرب واحد 
من المعاملات البولينية» ويتم تحديد التسلسل الطبيعي للبحث على النحو التالي: SL‏ 
المعامل ”في) عدا“ NOT‏ أولاء ويأتي المعامل ”و“ AND‏ ثانياء بين يأتي المعامل 
”أو“ OR‏ أخيرا. إلا أنه من الممكن تغيير التسلسل الطبيعي للمعالجة» بالنسبة” 
لعمليات البحث البوليني المركبة» باستعمال الأقواس > تدعو الحاجة. غير أن مثل 
هذا التغيير معقد ويتطلب الكثير» وخصوصا بالنسبة للمبتدئين. فقد لا يكون المستفيد 
قادرا على التكيف مع القواعد الاصطناعية (كمعالجة الأقواس الطولية أو الموغلة 
innermost‏ قبل غيرهاء على سبيل (JALI‏ من أجل تغيير التسلسل الطبيعي 
at Leal‏ بالنسبة لعمليات البحث البوليني المركبة» مالم تتح له فرصة التدريب 
والتمرس ASI‏ 

ثانياء من الصعب التعبير عن العلاقات غير البولينية بين المصطلحات (علاقة 
السببية على سبيل المثال) نظرا لأن هذا الأسلوب غير متوافر ببساطة في الأنموذج. 
لنفترض أن مستفيدا يود العثور على بعض المعلومات حول تطبيقات الحاسب في 
التعليم. حينئذ تتم صياغة استفسار بحث باستعمال المعامل البوليني ”و“ AND‏ 
”الحاسبات Ys computers AND education “ely‏ يرد مصطلح 
application “otik”‏ في الاستفسار, نظرا OF‏ هذه العلاقة من المفترض أن يتم 
التعبير عنها عن طريق المعاملات البولينية» إلا أن أيا من هذه المعاملات لا ينهض ole‏ 
الوظيفة. ومن ثم فإنه يإجراء عملية البحث ”الحاسبات والتعليم ' يمكن للمستفيد 
أن يحصل على معلومات» لا حول استخدام الحاسبات في التعليم فحسب» وإنما حول 
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تعليم الحاسبات أيضا. ويمكن ولا شك لصيغ البحث البوليني أن تكون في غاية 
التعقد. إلا أنه لا يزال هناك ثلاثة معاملات فقط متاحة للمستفيد» لكي يربط بها بين 
المفاهيم التي تتضمنها عملية البحث. Y ey‏ شك فيه بوجه عام» أنه كلما ازدادت 
صيغة البحث تعقدا زادت احتالات تسببها في التفسيرات غير الصحيخة» نظرا لعجز 
أنموذج المنطق البوليني عن التعبير عن علاقات أخرى خلاف علاقات المنطق 
البوليني بين المصطلحات. 

ثالثاء ليست هناك تقنية للوزن متاحة في أنموذج المنطق البوليني» لبيان الأهمية 
النسبية لمختلف المفاهيم في استفسار البحث. ومن المفترض أن تكون لجميع 
المصطلحات أو المفاهيم في الاستفسارات البولينية» الدرجة نفسها من aA‏ الأمر 
الذي لا يصدق [Slo‏ في استرجاع المعلومات. فإذا افترضنا على سبيل SEL‏ أن 
استفسار البحث هو ”الوصول إلى المعلومات والأمن“ information access‏ 
AND security‏ ويود المستفيد أن يركز أكثر على مصطلح cp eI”‏ وبعبارة 
أخرى» يود المستفيد الحصول على معلومات حول قضية الأمن في الوصول إلى 
المعلومات» بدلا من معالجة المصطلحين بوصفهم| متساويين في الأهمية. إلا أنه في نظام 
بوليني لاسترجاع المعلومات» قد لا يكون من الممكن تلبية توقع المستفيد» نظرا لعدم 
إمكان تخصيص أوزان لمصطلحات الاستفسارات. 

رابعاء من المستحيل التعبير عن الصلاحية الجزئية لنتائج عملية البحث. في 
أنموذج المنطق البوليني» نظرا OF‏ هذا الأنموذج ببساطة» يقسم جميع البيانات 
المتوافرة في النظام إلى فئتين؛ صالحة عندما تكون هناك مضاهاة بين الاستفسار وبدائل 
الوثائق» وغير صا حة عندما لا تكون هناك مضاهاة. وليست هناك فئة وسطء ومن ثم 
فإن نظم المنطق البوليني لا يمكن أن تقدم نتائج مرتبة تنازليا وفقا للصلاحية. ونظرا 
لأنه ليست هناك مخرجات مرتبة طبقياء فإنه لا يمكن للمستفيد أن يقرر» على سبيل 
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المثال» استرجاع الوثائق الخمسة عشر المتربعة على القمة. وعلى المستفيد غربلة جميع 
النتائج» التي أحيانا ما تعد بالآلاف أو Ast‏ التي لا يقدمها النظام البوليني في ترتيب 
معين للصلاحية. وعلى هذا النحو فإنه لا سيطرة للمستفيد على حجم المخرجات في 
عمليات البحث البولينية. 


خامساء يمكن للمستفيد أن يحصل على خرجات لا طائل من ورائها على 
الإطلاق» أو حرجات تشكل عبئا زائدا عليه» عند إجراء البحث البوليني. ويمكن 
للمخرجات أن تكون لا طائل من ورائها إذا كان استفسار البحث مقيدا إلى حد بعيد» 
كا هو الال على سبيل المشال» عندما تكون هناك عدة مصطلحات مرتبطة معا 
بالمعامل ””و“. ومن ناحية أخرى» يمكن للمخرجات التى تشكل عبئا زائدا أن تتأتى 
فعلاء إذا كان استفسار البحث عريضاء كا هو الحال ل سيا SLL‏ عندما ترتبط 
عدة مصطلحات معا بالمعامل ”أو“ OR‏ وبإمكان المستفيد تعديل استفسار البحث 
لزيادة محرجات عمليات البحث أو الحد منها. إلا أن الناتج حينئذ لن يكون ما كان 
يبحث عنه المستفيد من البداية» [Gly‏ خر be‏ الاستفسار المعدل. 

وللتغلب على ما يكتنف الأنموذج البوليني من قصورء اقترح كوبر 
Cooper (1988)‏ بعض الحلول الممكنة» كصياغة الاستفسارات خالية من المعاملات 
البولينيةء لتجنب عدم تعاطف الاستفسارات البولينية مع المستفيد: ومن المقترحات 
الممتازة لكوبر استمارة.البحث esearch form‏ على الرغم من أن هذا الاقتراح لم يطبق 
على نطاق واسع حتى خباية تسعينيات القرن العشرين. وفضلا عن ذلك تم أيضا 
تطوير عدد لا بأس به من الخوارزميات والطرق» بما في ذلك نماذج استرجاع 
المعلومات» من أجل توفير خرجات مرتبة طبقياء ومدخلات موزونة» وما شابه ذلك. 
إلا أن ”ناذج الاسترجاع الأخرىء التي يمكن أن تكون جديرة بالاهتمام نظرياء لم 
تحقق في التطبيق نتائج تفوق على نحو بارزء تلك النتائج الخاصة بنظم الاسترجاع 
البولينية''(63 (Korfhage, 1997, P.‏ . 
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أنموذج الفضاء المسجهي: 

تطور أنموذج الفضاء المتجهي vector space‏ الذي يعرف أيضا بالتجهيز 
المتجهي أو استرجاع الناتج المتجهي, على يدي سالتون Salton‏ وزملائهء الذين بنوا 
نظام معالجة النصوص System for the manipulation and hel- oly‏ 
(SMART ~ )|..)retrieval of texts‏ ليكون بمثابة أساس لإجراء سلسلة 
طويلة من تجارب استرجاع Salton, 1968) ob lall‏ على سبيل المثال). Wis‏ 
صممت سلسلة من أساليب استرجاع المعلومات (وزن المصطلحات» والمخرجات 
المرتبة طبقياء والتلقيم المرتد للصلاحية» على سبيل (JUM‏ في سياق عملية بناء 
الأنموذج. وإلى جانب المنطق البوليني» كان لأنموذج الفضاء المتجهي أكبر تأثير على 
تطور استرجاع المعلومات» ونظم استرجاع المعلومات العاملة & (Sparck Jones‏ 
Willett, 1997)‏ . 


وفي أنموذج الفضاء المتجهي» يتم تحديد كل مصطلح بوصفه أحد الأبعاد. بين 
يتم التعبير عن كل استفسار أو وثيقة بوصفه متجها. ويتكون المتجه فعلا من قائمة من 
قيم المصطلحات تثل مادة ما (أي استفسار أو وثيقة). ومن الممكن لقيم المصطلحات 
في المتجه أن تكون ثنائية أو موزونة. ويمكن للقيم الثنائية أن تكون واحد أو صفرء 
حيث يدل الواحد على وجود المصطلح في المادة. أما القيم الموزونة فتشمل أعدادا 
إيجابية حقيقية (مثل ٠.6‏ » و”".٠»‏ و7.5»و0.5). وتقابل القيمة الموزونة لكل 
مصطلح الأهمية النسبية لذلك المصطلح, في تمثيل هذه المادة (1997 (Kowalski,‏ 
ويمكن للخطة التي تستخدم لوزن المصطلحات في أنموذج الفضاء المتجهي» أن 
تكون موضوعية (كتردد المصطلحات مثلا) أو ذاتية أي غير موضوعية (كإدراك 
المستفيد أو فهمه مثلا). وطرق الوزن التي عالجناها في القسم 5/ /١‏ ۲/۲ قابلة نظريا 
للتطبيق في تحديد الأوزان للمصطلحات في متجه ما. ولكل خوارزمية للوزن مزاياها 
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وعيوها. وقد ناقشن كورفيج )1997( Korfhage‏ الطريقة القائمة على تردد 
المصطلحات تفصيلاء وكذلك الطريقة القائمة على إدراك المستفيد» بالنسبة لتحديد 


الأوزان للمصطلحات في متجه ما. 

ويتساوى عدد الأبعاد في متجه استفسار أو وثيقة ماء مع عدد المصطلحات 
المختلفة التي تمثل المادة. وتشكل جميع متجهات الاستفسار والوثيقة الفضاء متعدد 
الأبعاد. ومن ثم فإن المجموعة الكاملة لقيم المصطلحات في متجه ماء تدل على موقع 
الاستفسار أو الوثيقة ثيقة التي تمثلها في الفضاء )1997 .(Sparck Jones & Willett,‏ 

ويعني إجراء بحث في نظام الفضاء المتجهي لاسترجاع المعلومات» مراجعة 
المسافة مبينة كزاوية» بين متجهي الاستفسار والوثيقة في الفضاء. ويوضح أنموذج 
الفضاء المتجهي أوجه التشابه بين الوثيقة والاستفسار (أو بين أي وثيقتين) بمقارنة 
أبعاذهما المقابلة» وبحساب مقاييس التشابه هذه» بوصفها معامل جيب التهام cosine‏ 
coefficient‏ فإذا كان كل من الاستفسار والوثيقة حول موضوع مماثل» فإن الزاوية 
بين متجهيهما ينبغي أن تكون صغيرة» أما إذا كان الاستفسار والوثيقة حول 
موضوعات مختلفة» فإن الزاوية بين متجهيه) ينبغي أن تكون كبيرة )1997 (Lesk,‏ 
كذلك يمكن قياس أوجه التشابه بين الوثائق بالطريقة نفسها. 


مظاهر قوة أنموذج الفضاء المتحهى: 

يكفل أنموذج الفضاء المتجهي, كما ذهب سبارك جونز وولت Spärck‏ 
Jones and Willett (1997)‏ أساسا موحدا لمدى واسع من عمليات الاسترجاع» 
يشمل التكشيف. والتلقيم المرتد للصلاحية» وتصنيف الوثائق. وتتضح أوجه قوة 
هذا الأنموذج على أحسن وجه عندما تقارن بمظاهر قصور أنموذج المنطق البوليني. 
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أولاء لم يعد المستفيد بحاجة OY‏ يلم بالمنطق البوليني ويطبقه» عند إجراء . 
عمليات البحث في نظام استرجاع معلومات الفضاء المتجهي. إلا أن ما يتعين على 
المستفيد عمله هو أن يختار ببساطة عدة مصطلحات بناء على حاجته إلى المعلومات. 

ثانياء يمكن للمصطلحات أو المفاهيم التي يقع عليها الاختيار لتمثيل 
الاستفسار أو الوثيقة» أن توزن OL‏ أهميتها النسبية في المتجه. فإذا كان الاستفسار أو 
الوثيقة ميتم على سبيل المثال» أساسا بقضية الأمن في المشابكة» فإنه يمكن تخصيص 
وزن مرتفع ا الام“ tO‏ ووزن منخفض لصطلح SISA”‏ 
dey networking‏ هذا النحو لن يعامل هذان المصطلحان بوصفھ )| متساويين في. 
الأهمية في المتجه» ومن ثم يمكن الخروج بتمثيل ملائم للاستفسار أو الوثيقة. 

الثاء ترتب مخرجات عمليات بحث الفضاء المتجهي طبقياء تبعا لتناقص 
الصلاحية» نظرا لأن الأنموذج يعبر عن التشابه أو العلاقة بين الوثائق, أو بين 
الاستفسار ووثيقة ما على مقياس (من ٠.٠‏ إلى 2٠.١‏ حيث ٠.١‏ هو الأوثق صلة)» 
على سبيل المثال» عوضا عن التقسيم الثنائي (أي إما على صلة وإما ليس على صلة) كا 
يتم في أنموذج المنطق البوليني. ومن ثم فإنه بإمكان المستفيد أن يراجع» على سبيل 
المثال» الوثائق العشر المتربعة على القمة دون غيرهاء وهو على يقين من أن البقية» أي 
النتائج التي لم يراجعهاء لا يمكن أن تكون أوثق صلة بالاستفسار من الوثائق العشر 
التي استعرضها. وواقع الأمر أن قدرة المستفيد على الحد من حجم مخرجات 
الاسترجاعء ترتفع بالمقارنة بأنموذج المنطق البوليني. وتقتصد المخرجات المرتبة 
طبقياء في وقت المستفيد وطاقته في عملية استرجاع المعلومات» نظرا لأنه ليس على 
المستفيد النظر في جميع الوثائق» التي تبلغ الآلاف في غالب الأحيان» قبل أن يقرر أي 
الوثائق أوثق صلة من غيرها. وبإمكان النظام اختيار وتقديم أكثر الوثائق صلاحية 
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رابعاء يشكل التلقيم المرتد للصلاحية حة Li‏ تم تطبيقها في أنموذج الفضاء 

المتجهي» من أجل الارتفاع بمستوى أداء الاسترجاع. وبناء على الناتج الصالح الذي 
سبق استرجاعه» يمكن لنظام استرجاع المعلومات المعتمد على الفضاء المتتجهي» أن 
يكون قادرا على تعديل متجه الاستفسار تلقائياء وتقديم أكثر النتائج صلاحية 
للمستفيد. ويمكن للتلقيم المرتد الخاص بالصلاحية أن يتم دون تدخل المستفيد» كا 
يمكن تكرار العملية عدة مرات وفقا للضرورة. ومن الممكن للمستفيد أن يفل 
العملية في نظم استرجاع ole gles‏ الإنترنت» وذلك ببساطة بالاتجاه نحو الخيار 
الموسوم بعبارة ”المزيد ما يشبه هذا More like this‏ أو ”المزيد من النتائج المائلة 
More similar results:‏ ›. على سبيل المثال. 


وكا تبين GW‏ هذه المناقشة» فإن أنموذج الفضاء المتجهي قد تغلب على pars‏ 
أوجه القصور المرتبطة بأنموذج المنطق البوليني. إلا أن أنموذج الفضاء المتجهي قد 
أدخل أيضا بعض المشكلات الجديدة في مجال استر جاع المعلومات. 


أوجه قصور أنموذج الفضاء المتجهي: 

أول أوجه قصور أنموذج الفضاء المتجهي هو افتراض الانفصال بين 
المصطلحات التي يتم اختيارها لوصف متجه ما. وعند النظر في أنموذج المنطق 
البوليني يتبين أن الأنموذج لا يمكن أن يعبر عن ضروب أخرى من العلاقات» خارج 
نطاق المنطق البوليني. إلا أن أنموذج الفضاء المتجهي لا يستطيع التعبير عن أي 
علاقة» با في ذلك العلاقات البولينية بين المصطلحات. وبالأحرى فإنه ينطوي على 
الافتراض ob‏ تكون المصطلحات التي تشكل الأساس بالنسبة للفضاء المتجهي 
متعامدة أو مستقلة عن بعضها البعض. ويبدو أن هذا الافتراض غير صحيح؛ فإذا 
كانت المصطلحات التي اختيرت لوصف متجه وثيقة ماء هي ”السيارات“ 


3> 66 


و“التصدير“ و“ الاستيراد' automobiles, export and import‏ فكيف يمكن 
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أن نفترض أنه ليست ثمة Be‏ على GUY‏ بين المصطلحات الواردة؟ وقد انتقد 
هذا القصور بشدة في أوساط أولئك الذين بتمون بالأنموذج. 

ومظهر القصور الثاني في أنموذج الفضاء المتجهي» هو صعوبة تحديد علاقات 
الترادف أو العلاقات النحوية صراحة» نظرا لغياب المعاملات البولينية ومعاملات 
التقارب. ولكي نكون أكثر تحديداء فإن الأنموذج لا يدعم المعاملات البولينية 
ومعاملات التقارب. ومن ثم فإن المعامل ”أو“ YOR‏ يمكن أن يستعمل للدلالة 
على المترادفات |S)‏ في |S (cars OR automobiles‏ أن المعامل WITH “a”‏ لا 
يمكن أن يستعمل لتكوين عبارات (كم في (information WITH retrieval‏ 
متجه ما. إلا أنه في عمليات البحث الفعلية» هناك [Glo‏ ظروف تدعو الحاجة فيها إلى 
المترادفات أو العبارات» لتمثيل الاستفسارات أو الوثائق. ومن ثم فإنه من الصعب 
على المستفيد إجراء عمليات بحث بدون الإمكانيات البولينية» ومعامل التقارب في 
نظم استرجاع المعلومات القائمة على الفضاء المتجهي» عندما لا يكون قد تم التعبير 
عن علاقة الترادف والعلاقات النحوية بين المصطلحات. 

LÍ‏ مظهر القصور الثالث لأنموذج الفضاء المتجهي» فيتصل بتقنيته في الوزن» 
التي يمكن أن تكون غير موضوعية ومعقدة؛ فعملية الوزن تكون غير موضوعية 
عندما يطلب من المستفيد تحديد أوزان للمصطلحات» وخصوصا مصطلحات 
الاستفسار» وذلك بناء على فهمه أو تقديره اللخاص. ومن المفترض في المستفيد أن 
يقدر الأهمية النسبية التي يمكن أن يحظى بها المصطلح في عملية البحثء ثم يحدد وزنا 
له. ولا مناص من الذاتية في مارسة تلك العملية. ومن ناحية آخرى» يمكن للوزن أن 
يكون معقداء بحيث لا يمكن GY‏ خوارزمية للوزن أن تعمل بدون خللء كما أن 
العثور على أفضل خوارزمية لبيئة استرجاع معينة ليس بالمهمة السهلة. يضاف إلى 
رذلك» أن مراصد البيانات في نظم استرجاع المعلومات تتسم بالدينامية» نظرا لحاجتها 
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إلى التحديث المستمر. وهكذاء يمكن لأوزان المصطلحات أن تتغير تبعا لذلك» نظرا 
لأن المحددات التي تستند إليها طريقة الوزن (كتردد المصطلحات مثلا) قد تغيرت. 
وقد لخص كوالسكي )1997( Kowalski‏ عددا من طرق التعامل مع مراصد 
البيانات التي تتغير ديناميكياء وما لها من تأثير على خوارزميات الوزن. إلا أنه كا أشار 
كو لكي فيه بدن موي هله كاوق ها کی pa E TE‏ الحا وك 
(كالتكلفة مثلا). 

وإلى جانب argh‏ القصور الثلاثة التي تناولناها تواء يحتاج أنموذج الفضاء 
المتجهي أيضا إلى عدة مصطلحات لتمثيل استفسار ما أو وثيقة he‏ حتى يمكن 
للمتجه أن يكون قادرا على التمييز با فيه الكفاية» بالنسبة لأداء الاسترجاع المناسب. 
وفي مقابل AUS‏ ' يمكن لمصطلحين فقط أو ثلاثة ترتبط بالمعامل ”و“ AND‏ أن 
تكون كافية في بيئة بولينية» للحصول على مخرجات عالية الحو (Spärck Jones “ss‏ 
Willett, 1997, P. 259)‏ &. ويمكن لتخصيص المزيد من المصطلحات» في أنموذج 
الفضاء المتجهيء أن يؤدي إلى المزيد من التكلفة. وفضلا عن ذلك» يفتقر الأنموذج 
إلى التبرير النظري لبعض عمليات les‏ المتجهات؛ فاختيار أسلوب بعينه لحساب 
تشابه المتجه» في استعمال أنموذج استرجاع المعلوماتء على سبيل المثال لا يتقرر بناء 
على أي اعتبارات نظرية» ily‏ يترك الأمر للمستفيد )1989 (Salton,‏ 

وينبغي مثالياء أن يضع أنموذج الفضاء المتجهي» متجهات الوثائق على نحو 
يؤدي إلى تعنقد أو تجمع clustered‏ تلك الوثائق الصالحة لاستفسارات معينة معاء 
بينها يمكن لتلك الوثائق غير المرغوب فيها تزامنيا على الإطلاق» أن تبدو منفصلة في 
الفضاء )1975 (Salton, Wong & Yang,‏ إلا أن مضاهاة استفسار Le‏ مقابل 
مجموعات أو عناقيد من الوثائق» المساة بالفرضية العنقودية «cluster hypothesis‏ 
J‏ تتسن بعد )1997 (Spirck Jones & Willett,‏ 
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ولم يطبق أنموذج الفضاء المتجهي في كثير من نظم استرجاع المعلومات 
العاملة إلا بعد ظهور نظم استرجاع الإنترنت. ويتيح نظام سمارت SMART‏ الذي 
يعد بمثابة حقل الاختبار» بالنسبة لهذا الأنموذج» فرصة النمو والنضج. ولقد أدى 
ابتكار أنموذج الفضاء المتجهي إلى إثراء البحث والتطوير في Sle‏ استرجاع المعلومات 
إلى حل بعيد. 


أنموذج الاحتمالات: 

لقدأدخل مارون وكونز )1960( Maron and Kuhns‏ أنموذج 
الاحتمالات» الذي تطور فيا بعد على يدي روبر تصون وعدد آخر من الباحثين 
Robertson & Spärck Jones, 1976)‏ على سبيل المشال). وكما ذهب سبارك 
جونز وولت )1997( :Spärck Jones and Willett‏ 


إن الأساس المنطقي لإدخال المفاهيم الاحتالية واضح؛ 
فنظم استرجاع المعلومات تتعامل مع اللغة الطبيعية» وهذه تفتقر 
إلى الدقة إلى حد بعيد» بحيث تكفل للنظام القدرة على أن يقرر 
أي الوثائق يمكن أن تكون Les‏ بالنسبة لاستفسار معين 
(وهذا موقف يتناقض بوضوح مع عمليات الاسترجاع غير 
الغامضة. اللازمة للبحث في نظم إدارة مراصد البيانات 
العددية). (259 .م) 


ويطبق هذا الأنموذج نظرية الاحتمالات» أي الحالة التي يحتمل حدوثها مسن 
صفر با مئة إلى ٠٠١‏ بالمئة )٠.١ - ٠.٠(‏ لاسترجاع المعلومات. وهو يضع في الحسبان 
عنصر عدم التأكد في عملية استرجاع المعلومات» أي عدم التأكد فيا يتعلق با إذا 
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كانت الوثائق المسترجعة بواسطة النظام» صا حة بالنسبة لاستفسار معين أم لا 
-(Bookstein, 1985)‏ وبدف هذا الأنموذج إلى تقدير وحساب احتمال أن تكون 
T‏ عاط اينار د اهل aes‏ لازت . وتدل الحالة في هذا السياق 
الخاص باسترجاع المعلومات» على احتالات العلاقة بين الاستفسارات والوثائق. 
وعلى عكس الناذج الأخرى لاسترجاع ا معلومات» لا يعامل أنموذج الاحتالات 
العلاقة بوصفها مقياسا Lids‏ للإخفاق أو المضاهاة lly umiss-or-match‏ يتم 
التعبير عن العلاقة بناء على الاحتمالات. فمن الممكن على سبيل المثال للأنموذج أن 
يحيط مستفيدا ما علا بأن الوثيقة ”و“ احتالات ارتباطها بالاستفسار YOST?‏ بالمئة. 
ويتبع هذا الأنموذج طرقا Lake‏ لتحديد احتالات الارتباط بين 
الاستفسارات الوثائق. ويتم الحكم على الارتباط في أنموذج الاحتالات وفقا للتشابه 
بين الاستفسارات Gly‏ ويتوقف حكم الارتباط أيضا على تردد المصطلحات 
term frequency‏ ويمكن القول بوجه عام» أنه كلما زاد التشابه القائم بين 
الاستفسارات والوثائق» زادت احتالات أن تكون تلك الوثائق صالحة بالنسبة 
للاستفسارات. ومن المفترض في النظام الاحتمالي لاسترجاع المعلومات. في التتائج 
التي يتم الحصول عليها بالنسبة لأي استفسارء أن تتكون من الوثائق التي تفي 
بشروط ذلك الاستفسار» باحتمالات أعلى من حد معين )1997 .(Korfhage,‏ 


مظاهر قوة الأنموذج الاحتمالي: 


بالمقارنة بأنموذج المنطق البوليني أو أنموذج الفضاء المتجهي» يت يتمتع أنموذج 
الاحتمالات بمظاهر القوة التالية: 


أولاء يكفل هذا الأنموذج ”دليلا مها للتقسيم الفئوي لعمليات الاسترجاع» 
فضلا عن التبرير النظري للممارسات التي كانت تنبع فيها مضى» على أساس تجريبي أو 
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خر اھ emp‏ کإدخال نظم معينة لوزن المصطلحات على سبيل “OLE‏ 
(Salton, 1989, pp. 348-349)‏ وتتسم عمليات الاسترجإع بدرجة من عدم 
التيقن» عند الحكم على مدى قوة العلاقة بين الاستفسارات والوثائق. وفضلا عن 
ذلك تتقرر العمليات الجوهرية للأنموذجء كقياس التشابه بين الاستفسارات 
والوثائق» بواسطة الأنموذج نفسه» بدلا من أن تتقرر ببعض القرارات التغسفية» كا 
في أنموذج الفضاء المتجهي. 

ثانياء يتضمن:الأنموذج علاقات تبعية المصطلحات وما يرتبط بها (أي أن 
حدوث واقعة ما من شأنه أن يؤدي إلى حدوث الأخرى في تطبيقات هذا 
الأنموذج). dy‏ يعد المستفيدون بحاجة لافتراض استقلال المصطلحات بعضها عن 
بعض» كما كانوا في أنموذج الفضاء المتجهيء, وهو افتراض لا يحظى بالدعم في 
الممارسة العملية. كذلك يزن هذا الأنمو ذج مصطلحات الاستفسارات والارتباط بين 
الاستفسارات والوثائق» وبذلك يتمكن المستفيدون من معرفة الأهمية النسبية 
للمصطلحات أو الارتباط» في مهمة الاسترجاع. كذلك يوفر هذا الأنموذج 
المخرجات المرتبة طبقياء نظرا لأنه يفترض أن تكون المهمة الأساس لنظام استرجاع 
المعلومات» هي ترتيب الوثائق التي تتكون منها المجموعة» وفقا لتناقص احتالات 
الارتباط بحاجة المستفيد إلى المعلومات )1997 .(Sparck Jones & Willett,‏ 
ويسمى هذا الافتراض مبدأً الترتيب الطبقي للاحتالات. وبناء على مبدأ الترتيب 
الطبقي للاحتالات» يمكن للمستفيد أن يارس قدرا من التحكم في حجم مخرجات 
الاسترجاع. ويتم التعبير عن كل من الوزن والترتيب الطبقي بالاحتالات. 

WE‏ بإمكان هذا الأنموذج الإفادة من معلومات التلقيم المرتد» لتطوير طرق 
تستند إلى أساس متين )1985 .(Bookstein,‏ وعلى النحو نفسه أشار كوالسكي 
Kowalski (1997)‏ إلى أنه من الممكن هذا الأنموذج أن يتحقق بدقة» من افتراضاته 
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رابعاء لا يستخدم أنموذج الاحتمالات في شكله الأصلي» إمكانيات المنطق 
البوليني» التي يمكن أن يجد المستفيدون صعوبة في تطبيقها. ومن ثم فإن نظم 
استرجاع المعلومات القائمة على أنموذج الاحتمالات» أكثر تعاطفا مع المستفيد» من 
نظم الاسترجاع القائمة على المنطق البوليني. 
مظاهر قصور أنموذج الاحتمالات: 

حظيت مظاهر قصور أنموذج الاحتمالات بالدرس والتدقيق أيضاء من زوايا 
مختلفة منذ ابتكاره. [aby‏ يلي نلخص هذه المظاهر بإيجاز. 

أولاء على الرغم من أن قيمة الصلاحية في هذا الأنموذج متواصلة» بدلا من 
التقسيم الثنائي صفر أو واحدء كما في الأنموذج البوليني» فإن أنموذج الاحتالات 
يفترض أن تتسم الصلاحية بالثنائية» أي أن: 

Pr(nonret) = 1- Preen 

حيث Preen‏ هو احتهال الصلاحية» 3 Pr(nonrel)‏ هو احتهال عدم الصلا حية. 
وبعبارة أخرى Ob‏ القيمة بالنسبة لاحتمال عدم الصلاحية ثابتة بمجرد خساب 
احتمالات الصلاحيةء وبالتالي يتم استبعاد عامل عدم التيقن المجوهري» من عملية 
استرجاع المعلومات. فك أشار روبرتصون )1977( Robertson‏ فإن افتراض 
التقسيم الثنائي افتراض قوي» ومن المؤكد تقريبا أنه غير صالح بوجه عام. 

ثانياء لا يمكن لأنموذج الاحتالات أن يؤدي إلى الارتفاع بمستوى فاعلية 
الاسترجاع .على نحو ملحوظ؛ فالنتائج التي أمكن الحصول عليها باستععال أنموذج 
الاحتهالات» وإن كانت جيدة» لم تكن أفضل بط فيه الكفاية» من تلك المسترجعة من 
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نظم المنطق البوليني أو نظم الفضاء المتجهي..ومن الممكن طبيعيا أن يثار تساؤل حول 
ضرورة وجود أنموذج إضافي لاسترجاع المعلومات» بيغا لا يمكن لأذائه أن يكون 
lake‏ عن أداء النماذج القائمة. 

وبالإضافة إلى مظهري القصور اللذين تناولناهما هناء يكتنف هذا الأنموذج 
مظاهر قصور أخرى؛ فالتمرس في الرياضيات» على سبيل المثال» لا غنى عنه للإحاطة 
باستعمال نظرية الاحتمالات» الأمر الذي يمكن أن يؤثر سلبا في سهولة التعامل مع 
الأنموذج. يضاف إلى ذلك أن هناك كثيرا من الأشكال المختلفة للأنموذج؛ فهناك 
بعض مظاهر الاختلاف حول أي الطرق هي الأفضل» وكيف يمكن حسم مختلف 
القضايا التقنية» حتى وإن كان هناك إجماع أو اتفاق حول الأنموذج العام 
(Bookstein, 1985).‏ وعلى نحو ماثل لأنموذج الفضاء المتجهيء OLS‏ أنموذج 
الاحتمالات» حتى ظهور نظم استرجاع الإنترنت» يستعمل للأغراض التجريبية» أكثر 
ما كان يطبق في النظم العاملة لاسترجاع المعلومات. 


امتدادات النماذج الرئيسة لاسترجاع المعلومات: 


عادة ما ينظر لكل من المنطق البوليني» والفضاء المتجهي» والاحتالات» 
بوصفها الناذج الثلاثة الرئيسة لاسترجاع المعلومات. ولكل من هذه النهاذج 
امتداداته؛ فالمنطق البوليني الممتد» على سبيل المثال» امتداد لأنموذج المنطق البوليني 
وأنموذج الفضاء المتجهي مجتمعين. كذلك تستند الفئة الغامضة أو المشوشة fuzzy‏ 
set‏ إلى أنموذج المنطق البوليني» إلا أنها - فضلا عن ذلك- تدخل نظرية الفئات في 
استرجاع المعلومات. والتكشيف الدلالي الكامن latent‏ من اشتقاقات أنموذج 
الفضاء المتجهي؛ إذ يدف إلى العثور على مجموعة أصغر Lae‏ من الأبعاد والقيم» 
التي يمكن أن تستعمل بوصفها بديلا عن المصفوفة matrix‏ الأصلية (Lesk,‏ 
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(1997. وترتب شبكة الاستد لال inference network‏ وهي امتداد لأنموذج 
الاحتمالات» الوثائق طبقياء وفقا لتراجع الاحتمالات» وبذلك يمكنها أن تفي بحاجة 
المستفيد من المعلومات» لا باحتمالات أن تكون المعلومات صالحة» كما في أنموذج 
الاحتالات الأساس )1997 .(Sparck Jones & Willett,‏ 

ومن الممكن أن نجد امتدادات إضافية للناذج الأساس لاسترجاع المعلومات» 
في التقسيم الهرمي CH‏ استرجاع المعلومات» الذي طرحه كل من باييزا - بيتس 
وريريو - نتو )1999( .Baeza-Yates and Riberio-Neto‏ وسوف نتناول بمزيد 
من التفصيل» اثنين من الامتدادات الشهيرة» وهما المنطق البوليني الممتد» ومجموعة 
الغموض أو التشويش. في القسمين التاليين. 
أنموذج المنطق البوليني الممتد: 

من عيوب أنموذج المنطق البوليني» كما سبق أن ذكرناء عدم تقبل أوزان 
المصطلحات. كما أن من مظاهر ضعف أنموذج الفضاء المتجهي عدم القدرة على 
التعبير عن العلاقات المنطقية البولينية. وقد تطور أنموذج المنطق البوليني الممتد 
لاستيعاب المصطلحات الموزونة» مع المحافظة على البنية البولينية. وعلى الرغم من أن 
بوكستاين Bookstein‏ وآخرين قد أجروا أيضا بحوثاني هذا الموضوع 
Bookstein, 1978)‏ على سبيل المثال) op‏ هاري وو Harry Wu‏ هو من أدخل» 
تحت إشراف جيرارد سالتون Gerard Salton‏ أنموذج المنطق البوليني الممتد» بينا 
كان يكتب أطروحته )1981 (Salton, Fox & Wu, 1983; Wu,‏ 

dy‏ أنموذج المنطق البوليني الممتد يتم تخصيص أو تحديد أوزان المصطلحات 
بناء على أي ربط بين المحددات التالية؛ وهي التقارب. والموقع» والتردد» والصلة 
المتوقعة: وبفضل خاصية وزن المصطلحات» يمكن للأنموذج أن يقدم خرجات مرتبة 


257 


طبقياء وبذلك يتخكم في عدد الوثائق المسترجعة. وفي الوقت نفسه تتم المحافظة على 
مزايا تكوين الاستفسار البوليني المنضبط. 

إلا أن أنموذج المنطق البوليني الممتد» لم يطبق على نطاق واسع في استرجاع 
المعلومات» نظرا للأسباب التالية: أولاء من الصعب تحديد أوزان الملصطلحات على 
نحو فعال ودقيق» نظرا للقضايا نفسها التي أوجزناها في القسم ۷/ ۳/ ۲» في) يتعلق 
بأوجه قصور أنموذج الفضاء المتجهي. ثانياء يمكن للاستفسارات المتناظرة منطقياء 
أن تفشل في تقديم النتتائح نفسهاء عندما يتم تحديد أوزان Like‏ لمصطلحات 
الاستفسار )1997 .(Korfhage,‏ وعادة ما يسترجع المصطلح ثقيل الوزن عددا كبيرا 
من الوثائق. إلا أن هذا الأنموذج يحاول التغلب على ما يكتنف أنموذجي المنطق 
البوليني والفضاء المتجهي من قصورء وذلك بالجمع بين مظاهر قوتى|. وتدعم بعض 
نظم استرجاع الإنترنت (جوجل على سبيل المثال) البحث بالمنطق البوليني الممتد. 


أنموذج الفئات المشوشة: 

Gay‏ أنموذج الفئات المشوشة fuzzy set‏ الذي اقترحه في البداية زاده 
Zade (1965)‏ إلى التغلب على أحد مظاهر قصور أنموذج المنطق البوليني (وهو 
عدم القدرة على التعبير عن الصلاحية الجزئية لتتائج البحث)» وذلك بتعميم نظرية 
الفئات التقليدية. ففي الفئة التقليدية» إما أن يكون المقصود أو.الهدف في الفئة أو ليس 
في الفئة. وكذلك الحال Laf‏ فإن الوثيقة إما أن تكون صالحة أو مزتبطة»ء وإماغير 
صالحة بالنسبة لاستفسار معين» في النظام البوليني. ويعزل هذا الحد الفاصل أعضاء 
الفئة عن غير الأعضاء» أي الوثائق الصا حة عن الوثائق غير الصا حة. إلا أن مثل هذا 
الخط الفاصل لا وجود له تقريبا في استرجاع المعلومات» نظرا OV‏ النظام والمستفيد» 
لا يستطيعان في غالب الأحيان أن loud‏ بدقة» ما إذا كانت الوثيقة صاحة لاستفسار 
بعينه أم لا (1997 (Korfhhage,‏ وإنما يمكن للصلاحية الجزئية أن تكون أكثر دقة في 
التعبير عن الحكم. 
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ويعرف مفهوم العضوية الجزئية- المقايل لفكرة الصلاحية الجزئية» اللازم 
للارتفاع بمستوى أنموذج المنطق البوليني- بنظرية الفئات المشوشة. ويفترض هذا 
الأنموذج أن تكون الوثائق والاستفسارات المشوشة لا وجود لماء إلا أنه من الممكن 
dat ais a‏ الحو ب ام 
يتراوح بين *. ٠و‏ ۱.۰ حيث يدل ٠ ٠‏ (الواحد الصحيح) على العضوية الكاملة. 
كن daa hd lye‏ عدم تزا دحا مدره بع ١‏ 


ال e e a‏ 
الحاصلين على مرتبة الشرف. ويمكن للانتقاء أن يتم بطريقتين؛ أولاهما اتباع نظرية 
الفئات التقليدية بتعريف ”الطلبة المتفوقين“ على وجه التحديد» بوصفهم أولقك 
الحاصلون على المعدل التراكمي ۳.۹ فأكثر. ومن شأن أي طالب تنطبق عليه 
المواصفات أن يصبح عضوا في فئة الحاصلين على مرتبة الشرف. ولا يسمح لجميع 
الطلبة الحاصلين على معدل تراكمي أدنى من ۳.۹ أن يدخلوا أو يصبحوا أعضاء في 
هذه الفئة» حتى وإن كان من الممكن لبعضهم أن يكون حاصلا على معدل تراكمي 
4.” وني مقابل ذلك» فإن الطريقة يقة الأخرى لانتقاء الطلبة المتفوقين لمرتبة تبة الشرف» 
تستخدم نظرية الفئات المشوشة» وذلك بتحديد درجة عضوية لكل طالب. ومن ثم 
فإن الطلبة المتفوقين يتم تحديدهم بدرجات العضوية التي يحصلون عليها؛ فأولئك 
الذين حصلوا على معدل تراكمي مقداره ۳.۹ يمكن منحهم درجة العضوية 2٠.١‏ 
بينما يحصل الطلبة الذين يبلغ معدم التراكمي ٠.١‏ فأقل على درجة عضوية تقترب 
من ٠.٠‏ أما الطلبة الحاصلون على معدل تراكمي في الوسطء وليكن OTA‏ 
فيحصلون على درجة عضوية ٠.۸‏ على سبيل المثال. ومن ثم فإن الطلبة الذين لم 
يحصلوا على معدل تراكمي 27.4 يمكن أن يظلوا ضمن فئة الطلبة المتفوقين» إذ تدل 
درجات عضويتهم على ارتباطهم بالفئة. 
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وفي تطبيق نظرية الفتات المشوشة في استرجاع المعلومات» يمكن الحكم على 
صلاحية الوثائق» بوصفها صالحة أو غير صالحة» فق ط» كما يحدث في نظام المنطق 
البوليني» وعوضا عن ذلك يمكن تحديد درجة عضوية للوثائق للدلالة على مدى قوة 
Lala‏ إلى فئة الوثاتق الصالحة. وتتقرر درجات العضوية بالنسبة للفئة المشوشة من 
الوثائق» من جانب المكشف في أثناء عملية التكشيف )1985 .(Bookstein,‏ 

وتشمل مظاهر قوة أنموذج الفئات المشوشة التخفيف من حلة القيود 
الصارمة في أنموذج المنطق البوليني» أي أن تكون الوثائق إما صالحة للاستفسار وإما 
غير صالحة» دون السماح بالصلاحية الجزئية. وفي تحديد درجة العضوية يمكن لنظام 
الفئات المشوشة لاسترجاع المعلومات» أن يوفر خرجات مرتبة طبقياء وفقا لتناقص 
الصلاحية» بحيث يكون بإمكان المستفيد الاتجاه نحو النظر في التتائج المتربعة على 
القمة. وفضلا عن ذلكء فإنه تتم المحافظة على بنيان الاستفسار البوليني في 
الأنموذج» للتعبير عن العلاقات المنطقية. وتصلح النظم القائمة على أنموذج الفقات 
المشوشة للاسترجاع الاستكشافي. 

بيد أن نظام استرجاع المعلومات القائم على الفئات المشوشة لا يتسم بالمرونة 
كا ينبغي» نظرا لأنه لا يحدد أوزانا لمصطلحات الاستفسارات في مقابل مصطلحات 
الوثائق . وهذاء فإن قيم استرجاع الوثائق تتوقف فقط على قيم مصطلحات الوثائق 
(Salton, 1989)‏ وتتعلق هذه العبارة بتداعيات المحافظة على الإطار البوليني» 5 
أنموذج الفئات المشوشة؛ ففي مثل عمليات البحث البولينية هذه» التي تستعمل 
المعامل ”أو 0٣‏ (مثل أ أو ب أو ج) من المفترض في الوثيقة 1الرتبطة بمصطلح 
استفسار واحد فقط (أي أ) أن تكون مهمةء شأنها في ذلك OLS‏ الوثيقة ثيقة 22 التي 
تشتمل على جميع مصطلحات الاستفسار (أي dd‏ وب» وج). Ley‏ لاشك فيه أن قيمة 
أو صلاحية الوثيقة DI‏ يتم الحكم عليها بناء على مصطلح واحد فقط (أي أ) في هذه 
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OV 1s LL‏ ت pas dole‏ وجا lod Ul‏ سناع راف 
التي تستعمل المعامل ”و“ AND‏ (مثل أو ب وج) فإن الوثيقة 01 التي تشتمل على 
جميع مصطلحات الاستفسار (ed‏ عدا واحد (أي أو ب) تعد بلا طائل» أي غير 
صالحة» شأنها في ذلك شأن الوثيقة 12 التي لا تشتمل على أي من مصطلحات 
الاستفسار على الإطلاق. 
وقضلا عن ذلكء فإنه بالقارنة بأنموذج الفضاء المتجهيء OB‏ أنموذج LMI‏ 
المشوشة لا يوفر أي وسيلة للتعبير عن الاستفسارات. dy‏ مقابل أنموذج 
الاحتمالاتء فإن أنموذج الفئات المشوشة أقل تماسكا من الناحية النظرية على الأقل. 
ولا يطبق هذا الأنموذج سوى في حالات متفرقة نادرة» في SLE‏ استرجاع المعلومات. 


كما بينا في بداية هذا الفصلء فإن نماذج استرجاع المعلومات والامتدادات التي 
أوضحناها حتى الآن» ترتبط بالنظم في المقام الأول. وترتبط ناذج أخرى لاسترجاع 
المعلومات بمحددات مختلفة؛ فالأنموذج المعرفي» على سبيل المثال» يضع في الحسبان 
عامل المستفيد في استرجاع المعلومات» وسوف نتناول هذا الأنموذج في 
الفصل العاشر. 
مراجعة للنماذج الرئيسة لاسترجاع المعلومات: 

قدمنا في الأقسام السابقة معالجات سردية للناذج الثلاثة الرئيسة لاسترجاع 
المعلومات» وهي المنطق البوليني» والفضاء المتجهي» والاحتالات. وقد قصد 
بالجدول رقم V/V‏ تلخيص بعض الخصائص المهمة هذه النماذج. 
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الجدول رقم ۷/ ١‏ خصائص الناذج الثلاثة لاسترجاع المعلومات 





ونعيد النظر في الناذج الثلاثة الواردة في الجدول رقم V/V‏ من خمسة جوانب 
ا ا ا Sie O‏ 
)1( هل ترتب المخرجات طبقيا؟ )٤(‏ أي معايير المضاهاة تطبق للتحقق من التشابه 
بين الاستفسارات والوثائق؟ )0( هل هناك خاصية فريدة؟ وتبين هذه الجوائنب 
الخمسة. إلى حد بعيد» مظاهر قوة ناذج استرجاع المعلومات ومواطن ضعفها. فتوافر 
إمكانية البحث البوليني» على سبيل SLM‏ تتيح للمستفيد القدرة على تكوين 
استفسارات محكمة. ومن ناحية أخرى» يمكن للخاصية نفسها (أي المنطق البوليني) 
أن fad‏ نظام استرجاع المعلومات غير متعاطف مع المستفيد» نظرا للصعوبات التي 
ينطوي عليها إجراء عمليات البحث البولينية. 

ويبدو أنموذج المنطق البوليني هو الأضعف من بين الناذج الثلاثة» الواردة في 
الجدول رقم ۷/ ١؛‏ فهو لا يدعم سوى البحث البوليني فقطء و تتوقف المضاهاة على 
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وجود المصطلح في النظام. إلا أن هذا الأنموذج يستخدم بكثافة» ويطبق على نطاق 
واسع في استرجاع المعلومات. Lal‏ الأنموذجان الآخران فيبدوان متشاهين على 
السطح؛ إذ ele]‏ في شكلهما الأصلي لا يشتملان على المنطق البولينيء إلا أا يكفلان 
تقنيات الوزن والترتيب الطبقي. إلا أن المعايير التي تستخدم من جانب أنموذجي 
الفضاء المتجهي والاحتالات. لوزن المصطلحاتء وترتيب المخرجات طبقيا» وقياس 
التشابه» مختلفة. يضاف إلى ذلك أن تلقيم الصلاحية المرتد قد أضيف كإمكانية 
استرجاع فريدة في أنموذج الفضاء المتجهي. وقد بذلت جهود لاستعمال أي من 
أنموذجي الفضاء المتجهي Vice Vy‏ لتطوير نظم أفضل لاسترجاع المعلومات. 
إلا أن مثل هذه النظم لم تكن قادرة على أن تتفوق في أدائهاء على النظم القائمة على 
أنموذج المنطق البوليني )1997 .(Korfhage,‏ 


نماذج استرجاع المعلومات في مقابل تقنيات الاسترجاع: 

قدمنا وناقشنا في الفصل الخامس مختلف تقنيات الاسترجاع» فا العلاقة إذن 
بين نماذج استرجاع المعلومات وتقنيات الاسترجاع؟ وبين| لا نجد هناك أي ارتباط 
دقيق» أو مباشر صريح بين الطرفين» فإن بعض تقنيات الاسترجاع ترتبط بوضوح 
باذج استرجاع المعلومات التي اشتقت منها؛ فالبحث البوليني» على سبيل الممال» 
تطبيق ولاشك لأنموذج المنطق البوليني. كذلك تحظى توسعة الاستفسارات» وتلقيم 
الصلاحية المرتد على وجه الخصوص.ء بالدعم من جانب أنموذج الفضاء المتجهي. 
ومن الممكن للبحث بالمصطلحات الموزونة أن يستند إلى خوارزميات تطورت في 
أنموذج الاحتمالات» أو أي ils‏ أخرى لاسترجاع المعلومات» كالمنطق البوليني 
الممتد be‏ سبيل المثال. 

وإلى جانب تقنيات الاسترجاع تلك» ذات الأصول المعروفة بوضوح» تستند 
بقية التقنيات أيضا إلى ناذج استرجاع المعلومات؛ فالبحث بالتقارب على سبيل المثال» 
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تمتد جذوره في الأنموذج البوليني الممتد. وفضلا عن ذلك. فإن تقنيات الاسترجاع 
ليس من الضروري أن zas‏ تشتق من أنموذج استرجاع المعلومات نفسه الذي ينبغي أن 
يستخدم معها أثناء عملية البحث. ومن الممكن لكل من الناذج والتقنيات 
أن تستخدم جنبا إلى جنب» بصرف النظر عن مصادرها أو أصوهاء إذا ما كان نظام 
استرجاع المعلومات قد صمم على هذا النحو. وواقع الأمر أن بناء نظم استرجاع 
المعلومات متعددة le‏ ينبغي أن يحظلى بالتشجيع» »عل التحوالمبين 
E‏ القسم FAN‏ 

ويمكن BAIL ibl‏ بين نمأذج استرجاع المعلومات وتقنيات الاسترجاع 
أن تساعد في اختيار النظم المناسبة لمهام الاسترجاع. ومن بين الأمثلة الواضحة أن 
النظام البوليني يمكن أن يقع عليه الاختيار إذا كانت لدى المستفيد الرغبة في إجراء 
عمليات البحث البوليني. وإذا كان الأمر يتطلب إجراء بحث بناء على وزن 
المصطلحات. فإنه يتعين على المستفيد اختيار نظام لاسترجاع المعلومات» يستند إلى 
أنموذج الفضاء المتجهي» على سبيل المثال. 
في الطريق إلى نظم استرجاع المعلومات متعددة النماذج: 

لنماذج استرجاع المعلومات» كما تناولناها في هذا الفصلء ماما وما عليها. ومن 
ثم فإن نظم استرجاع المعلومات التي تطبق هذه النماذج» لا يمكنها سوى إنجاز مهام 
استرجاع معينة فقط. ولاستغلال مزايا ما لمختلف ناذج استرجاع المعلومات من 
مظاهر قوة» ينبغي بناء نظم استرجاع المعلومات بحيث تتضمن خصائص من نماذج 
استرجاع معلومات متعددة. وقد عبر فرانتس Frants‏ وآخرون عن فكرة AG‏ 
(Frants, et al, 1999)‏ وإن کانوایسمون النظم التي تتبع مبادئ متعددة 
لاسترجاع المعلومات ”النظم متعددة الطبعات multiversion systems‏ . 
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وتدل الممارسات الراهنة في Sle‏ استرجاع المعلومات» على أن المنطق البوليني 
هو الأنموذج الوحيد الذي يطبق في جميع نظم استرجاع المعلومات تقريباء (cy‏ تطبق 
النماذج الأخرى تدريجيا في نظم كنظم استرجاع الإنترنت. ویک Ch LY‏ 
المعلومات أن تكون بدائية جداء كا يمكن أن تكون في غاية التطور. وينبغي لنظم 
استرجاع المعلومات اللازمة لمعالجة هذه الاستفسارات» أن تصمم تبعا لذلك» باتباع 
طرق متعددة النماذج. ونظم استرجاع المعلومات متعددة النماذج» في تزايد مستمر على 
الإنترنت» التي في سبيلها OY‏ تصبح منصة رئيسة لنظم استرجاع المعلومات. 

والقضية الأخيرة فيه يتعلق بنظم استرجاع المعلومات متعددة الناذج» هي 
كيف يمكن لمختلف ناذج استرجاع المعلومات أن تتكامل. ومن الممكن الاسترشاد 
بمشروعات مثل مؤتمرات استرجاع النصوص (ترك Text Retrieval (TREC‏ 
Conferences‏ في هذا الصدد. كذلك ينبغي أيضا التعرف على atl‏ المستهدف 
من نظام استرجاع المعلومات» من أجل التحقق من احتياجاته المعلوماتية على نحو 
أفضل في هذا العصر الرقمي. 
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الفصل الثامن 
نظم استرجاع المعلومات 


يتم إنجاز مهام استرجاع المعلومات في إطار نظم استرجاع المعلومات. وقد 
تطورت أنواع مختلفة من نظم استرجاع المعلومات» منذ خمسينيات القرن العشرين» 
لتلبية OL‏ مختلفة من الاحتياجات المعلوماتية. ونظم الخط SLU‏ ونظم 
الأسطوانات المكتنزة (CD-ROM‏ والفهارس المتاحة للجمهور على الخط المباشر 
(أوباك (OPACS‏ ونظم استرجاع معلومات الإنترنت» هي الفئات الأربع الرئيسة 
لنظم استرجاع المعلومات» التي تخدم المستفيدين» بقدرات متفاوتة» لتلبية طلباتهم 
المعلوماتية. ونتناول في هذا الفصل بالدرس» كل نوع من النظم» لبيان مقوماتها 


نظم الخط المباشر: النظم الرائدة لاسترجاع المعلومات: 

غالبا ما يتم اختصار نظم انط المباشر online‏ لاستر جاع المعلومات. التي 
تسمى أيضا نظم الخط المباشر المهنية» كنظم الخط المباشر» أو مراصد بيانات الط 
الأخيرة. وهذه هي أول أنواع نظم استرجاع المعلومات» التي استخدمت تقنيات 
الحاسبات. وديالوج DIALOG‏ والمدلاين MEDLINE‏ مثالان لنظم الخط المباشر 
لاسترجاع cabs gla‏ 


LAN فرص التعامل مع مراصد بيانات متعددة على‎ rey: host الواقع أن ديالوج نظام مضيف‎ Ge) 


المباشر. أما المدلاين فهو الشكل الذي اتخذه نظام تحليل الإنتاج الفكري الطبي (المدلرز 
(MEDLARS‏ عندما أتيح التعامل ane‏ على الخط المباشر. (المترجم) 
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وتكفل نظم الخط المباشر للمستفيد» بمساعدة الحاسب وتقنيات الاتصالات 
بعيدة المدى» فرصة البحث في مراصد البيانات القائمة في أماكن نائية. وكانت النظم 
في البداية تدعم التعامل على دفعات oi) hz batch processing‏ أن طلب البحث 
لم يكن يعالج فورا بمجرد تقديمه» [ify‏ كان يعالج [ed‏ بعد» عندما يتجمع عدد معين 
من الطلبات)» ثم أدخلت فيا بعد مقومات التفاعل الفوري بين المستفيد والنظام. 
وقد مر تطور نظم الخط المباشر في ثلاث مراحل (1980 ‘Bourne,‏ 

« دراسات الجدوى والمشروعات الريادية: خسينيات القرن العشرين. 

° الإنتاج بمجتمعات محدودة من المستفيدين: ستينيات القرن العشرين. 

o‏ خدمات استرجاع المعلومات الوطنية أو الدولية: من سبعينيات القرن 

العشرين حتى الوقت الحاضر. 

وقد قدم هان )1996( Hahn‏ معالحة مستفيضة للرواد الذين شاركوا في تطوير 
نظم الخط المباشر. وتتبع بورن Bourne and Hahn (2003) oles‏ تطورات نظم 
الخط المباشر بين عامى AV Ty ١977‏ ففى أعقاب التطورات والتحسينات التى 
تحققت منذ خمسينيات القرن العشرين» أصبحت نظم الخط المباشر فئة متميزة من نظم 
استرجاع المعلومات» في العصر الرقمي. 
خصائص نظم الخط المباشر لاسترحاع المعلومات: 

لقد كانت نظم الخط المباشر تجمع في المقام الأول» المعلومات الوراقية وبععض 
المعلومات العددية قبل ثانينيات القرن العشرين» ثم أصبحت بعد ذلك تشمل 
معلومات النصوص الكاملة. وقلا ينظر إلى معلومات الوسائط المتعددة في هذا النوع 
من نظم الاسترجاع. ويتم اختيار المعلومات القني تتضمنها نظم الخط ALM‏ 
وتنظيمها بواسطة اختصاصين (كالمكشفين مثلا). وتستعمل اللغات المقيدة بكثافة» 
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لأغراض تنظيم المعلومات واسترجاعهاء كا يحظى البحث USL‏ المفتاحية بالدعم 
في الوقت نفسه. وكانت لغة الأوامر command‏ هي القاعدة بالنسبة للمستفيدين» 
للتفاعل مع نظم الخط المباشر» إلى أن تم إدخال الاختيار من قوائم الخيارات» في 
ثهانينيات القرن العشرين. ثم بدأ استخدام واجهات التعامل التصويرية graphical‏ 
تدريجياء في تسعينيات القرن العشرين» وخصوصا عندما بدأت نظم الخط المباشر 
تستخدم العنكبوتية العالمية بوصفها منصة AB‏ 

وقد اتبعت فئات متغددة من تقنيات الاسترجاع. ونماذج استرجاع المعلومات» 
في نظم الخط المباشر. والتقنيات الأساس للاسترجاع» كالبحث البوليني» والبحث 
بمراعاة شكل الحرف الأولء والبترءو البحث بالتقارب» والبحث بالحقول» متاحة في 
جميع نظم الخط المباشر تقريبا. أما تقنيات الاسترجاع المتطورة» كالبحث الموزون» 
والبحث المشوش fuzzy‏ وتوسعة الاستفسارات» وإن كانت لا تحظى بالدعم في 
جميع نظم الخط المباشرء فإنها يمكن أن تتوافر في بعض التطبيقات. وواقع الأمر أن 
نظم الخط المباشر كانت» LS‏ قبل منتصف تسعينيات القرن العشرين» بمثابة بيئات 
اختبار بالنسبة للبحث والتطوير في استرجاع المعلومات. كا كانت هذه النظم أيضا 
تقوم مقام نوافذ العرض بالنسبة لتقنيات استرجاع المعلومات» قبل ظهور نظم 
استرجاع الإنترنت؛ فقد كان ديالوج على سبيل المثال» يكفل المخرجات المرتبة طبقياء 
باستعمال الأمر RANK‏ في عام Basch, 1993) ١991"‏ 

وفضلا عن ذلك» يمكن النظر إلى نظم الخط المباشر بوصها ختبرات لاكتساب 
وتنمية مهارات استرجاع المعلومات» لعدة أسباب؛ أوهما أن النظام يتم بناؤه بحيث 
يكفل المارسة والمعالجة المنضبطة. وهناك بعض نظم LL‏ المباشر التي توفر مقومات 
خاصة (كملفات وورش عمل أونتاب ديالوج (“DIALOG's ONTAP‏ 


)*( الاسم المختصر لبر يات التدريب على الخط المباثر -Ontine Training and Practice‏ (المترجم) 
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للمساعدة في تدريب المستفيدين. ثانياء كانت نظم الخط المباشر تمثل النظم الإلكترونية 
الوحيدة لاسترجاع المعلومات المتاحة في ذلك الوقت. LSE‏ من الممكن اختبار 
وتجريب فئات متنوعة من مهارات الاسترجاع في نظم الخط المباشر. إلا أن السبب 
الرابع يأتي في الجانب السلبي؛ فمن المفترض أن يحصل المستفيدون من نظم الخط 
المباشر حت| على التدريب» قبل الإفادة من هذه النظم أو التعامل معها. فالنظام ليس 
حدسيا أو بدهياء ولا يمكن الإلمام به ببساطة بالتجربة والخطأ. ونتيجة لذلك» فإن 
المستفيدين النهائيينء في البحث على الخط المباشر اختصاصيو معلومات بوجه cple‏ 
يقومون بدور وسطاء البحث» بين النظام والمستفيد الذي يحتاج إلى المعلومات. 


نظم الخط المباشر واسترجاع المعلومات: 

من بين الأنواع الأربعة لنظم استرجاع المعلومات التي تحققنا منها ني هذا 
الفصلء تتمتع نظم الخط المباشر بأطول تاريخ» كما أن لما أقوى تأثير في استرجاع 
المعلومات. فهذه النظم ترسي ضمنيا المواصفات المعيارية التي تلتزم بها النظم 
الأخرى. وحيئ) يظهر نوع جديد من نظم استرجاع المعلومات» [tla‏ ما يقارنه 
المستفيدون المحتملون بنظم الخط المباشرء ليروا إلى أي حد يمكن للوافد الجديد أن 
يعمل بكفاءة في المجال؛ فقد J sli‏ نال-جاكوبوفيتز وتينوبير Nahl-Jakobovits‏ 
cand Tenoir (1992)‏ على سبيل المثال بالدرس» جوانب زمن الاستجابة» 
والتغطية» والمحتوى» والتكلفة» في كل من طبعتي المستخلصات السيكولوجية 
Psychological Abstracts‏ والمستخلصات الاجتاعية Sociological‏ 
Abstracts‏ على الأسطوانات المكتنزة وعلى الخط المباشر. وقارن هيلدرث 
Hildreth (1988)‏ الفهارس المتاحة للجمهور على الخط المباشر بنظم استرجاع 
المعلومات على الخط SLL‏ واستكشف احتالات إدخبال خصائص نظم الخط 
المباشر» في الفهارس المتاحة للجمهور على الخط المباشر. كذلك قارنت تشو Chu‏ 
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)1998( نظم استرجاع الإنترنت بنظم الخ ط Ge Ltt‏ جوانب كبناء مراصد 
البيانات» وإمكانيات الببحث ela Vig‏ ف الاسترجاع» وخيارات المخرجات» 
وجهد المستفيد. 


ويبدو أن نظم الخط المباشر قد أثبتت مكانتهاء بوصفها النظم التي يقاس 
عليهاء في استرجاع المعلومات. إلا أنه كا سبق أن ذكرناء Op‏ نظم الخط المباشر» أبعد 
ما تكون عن الكمال؛ فالتكلفة المرتفعة» وغياب التعاطف مع المستفيد» من الخصائص 
التي غالبا ما ترتبط od,‏ الفئة من النظم. ومن ناحية أخرى» OB‏ الدور الرائد الذي 
مضت به نظم الخط المباشرء في استرجاع المعلومات» يحظى أيضا بالتقدير على 
نطاق واسع. 


نظم الأسطوانات المكتنزة: وسط مختلف لنظم استرجاع المعلومات: 

نشأت نظم الأسطوانات المكتنزة عن تطبيق تقنيات هذه الأسطوانات في 
استرجاع المعلومات» وحققت إلى أبعد حد» جزءا نما صممت لتحقيقه في مجال 
استرجاع المعلومات» مسايرة لما حققت تقنيات العنكبوتية العا ية من نضج. ونتناول 
هذه النظم في هذا الفصل» من أجل استكال صورة مشهد نظم استرجاع المعلومات» 
في المقام الأول. وعادة ما يتم البحث في نظم الأسطوانات المكتنزة محلياء إذ لا تعتمد 
هذه النظم على الاتصالات بعيدة المدى» للتعامل معها مالم تكن النظم متشابكة. 
وكان مرصد بيانات الإنتاج الفكري السيكولوجي PsycLIT‏ الذي تتبناه مؤسسة 
سيلفر بلاتر SliverPlatter‏ مثالا لنظم الأسطوانات المكتنزة. 

ومن الممكن النظر إلى نظم الأسطوانات المكتنزة» على نحو ماء بوصفها نظم 
خط مباشر» على وسط الأسطوانات المكتنزة» نظرا OY‏ هذين النوعين من نظم 
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استرجاع المعلومات يتقاسمان كثيرا من الخصائصء ولأن نظم الأسطوانات المكتنزة 
مصممة على غرار نظم الخط المباشر» على AST‏ من نحو. وفضلا عن ذلك فإن نظم 
الأسطوانات المكتنزة لم تطبق على نطاق واسع» إلا في ثمانينيات القرن العشرين» عندما 
أصبحت نظم الخط المباشر بالغة التأثير في المجال فعلا. 

ولا تبدو هناك مراحل واضحة في تطور نظم الأسطوانات المكتنزة. ومن بين 
الأسباب الرئيسة هذه الظاهرة» أن هذه النظم لم تبدأ من الصفره ily‏ نشأت بوصفها 
مزاوجة بين الأسطوانات المكتنزة الناشئة» ونظم الخط المباشر الناضجة» باستخدام 
الأولى كوسط اختزان جديد. ولهذا فإن الخصائص الفريدة لنظم الأسطوانات المكتنزة 
تتأثر إلى حد بعيد» بخصائص الأسطوانات المكتنزة كوسط. 


خصائص نظم الأسطوانات المكتنزة: 

لا تزال المعلومات الوراقية» والعددية أو الإحصائية» والنصوص الكاملة» هي 
مصادر المعلومات الغالبة» التي يتم تجهيزها في نظم الأسطوانات المكتنزة. إلا أن زيادة 
في طاقة اختزان معلومات الوسائط المتعددة» حدثت عندما أصبحت تقنيات 
الأسطوانات المكتنزة أكثر قدرة من نظم الخط المباشر» في معالجة مثل هذه الأنواع من 
المعلومات. ولا تزال نظم الأسطوانات المكتنزة متعددة الوسائط» هي المستخدمة في 
بعض الظروف (كالموسوعات على سبيل COU‏ وتستخدم اللغات المقيدة لأغراض 
تنظيم المعلومات واسترجاعهاء مرتبطة باللغة الطبيعية. ولا يزال التدخل البشري 
كثيفاء في استرجاع معلومات الأسطوانات المكتنزة. وقلا نجد لغة الأوامر في نظم 
الأسطوانات المكتنزة» إذ يطبق الاختيار من قوائم الخيارات في غالب الأحيان. وقد 
ظهرت واجهات التعامل التصويرية أول ما ظهرت في بيئة الأسطوانات المكتنزة» كا 
أن بعض النظم تتبع البنيان الفائق hyperstructure‏ في تطبيقاتها. 
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وتحظى تقنيات الاسترجاع الرئيسة (كالبحث البوليني» والبحث بالتقارب على 
سبيل المثال) بالدعم في نظم الأسطوانات المكتنزة» أما إمكانيات البحث المتقدم 
(كالبحث بالوزن والترتيب الطبقي للمخرجات على سبيل المثال) فتطبق على نطاق 
محدود. وليس من غير المألؤف أن نجد أن نظاما واحدا بعينه» قد تم اختزانه على عدة 
اسطوانات مكتنزة» الأمر الذي يمكن أن يحول دون تطبيق بعض تقنيات الاسترجاع 
المتقدمة في النظام. 

وبفضل سعتها الاختزانية العالية» وحجمها المادي الصغير نسبياء فإن نظم 
الأسطوانات المكتنزة قابلة نظرياء للتعامل معها في أكثر من منصة واحدة «portable‏ 
نظرا لإمكان استيعاب عدة أسطوانات لجميع المعلومات اللازمة في مرصد بيانات 
معين. إلا أن مرصد البيانات code y‏ لا يمكن أن يعمل كنظام لاسترجاع المعلومات. 
ويتطلب تشغيل النظام تجهيزات خاصة. ومن ناحية أخرى. فإنه يمكن أن يكون من 
الأكثر ملاءمة بالنسبة للمستفيد» أن يبحث في نظم الأسطوانات المكتنزة» نظرا لأنها لا 
تعتمد على تقنيات الاتصالات بعيدة المدى في تشغيلها. وإجراء عمليات البحث في 
الأسطوانات المكتنزة أقل تكلفة» نظرا لأنها لا تتحمل رسوم الارتباط أو أي رسوم 
أخرى بمجرد شراء النظم وتركيبهاء ومن ثم فإنه يمكن للمستفيدين إجراء عمليات 
الببحث» دون الاكتراث با إذا كانت دقات الساعة تصدر أصواتهاء ويمكنهم التركيز 
أكثر على البحث نفسه. 

والمستفيد النهائي لا الوسيط» هو من يقوم بإجراء معظم عمليات | لبحث في بيئة 
الأسطوانات المكتنزة. ومن بين أسباب ذلك أنه وفقا لسياسة الرسوم الثابتة» والتعامل 
غير المحدود, فإن نظم الأسطوانات المكتنزة لا تفرض Bale‏ رسوما إضافية على المستفيد 
النهائي. أما السبب الثاني فهو أن واجهة تعامل نظم الأسطوانات المكتنزة» أكثر تعاطفا 
ومراعاة لظروف المستفيد» من نظم الخط المباشرء نتيجة لاستخدام قوائم الخيارات 
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والواجهات التصويرية. ثالثاء تحث نظم الأسطوانات المكتنزة» وتشجع على التصفح» 
نظرا لأن تكلفة الخط المباشر لا تشكل عبئا بالنسبة للمستفيد النهائي في هذه الحالة. وكا 
تبين لنا في الفصل السادس» فإن التصفح والبحث هما النهجان الرئيسان للاسترجاع» 
والأول هو المفضل في بعض الظروف. وبالمقارنة فإن التصفح في جلسات الاسترجاع 
على الخط المباشر يبدو مرتفع التكلفة. 

إلا أن نظم الأسطوانات المكتنزة يكتنفها بعض القصور في التحديث. إذ 
ينطوي كل تحديث على إحلال الأسطوانات القائمة؛ الأمر الذي يحد على نحو 
ملحوظ من معدل تردد التحديث أو تكراره. وعادة ما يكون معدل تحديث نظم 
الأسطوانات المكتنزة فصليا أو نصف سنوي» بينا يمكن لتحديث ما يقابل هذه النظم 
من نظم الخط المباشر أن يتم أسبوعيا أو يومياء lesa‏ على نحو مستمر (كأخبار بردج 
للأسواق العالمية Bridge World Markets‏ على ديالوج DIALOG‏ على سبيل 
المثال). ويمكن لسرعة البحث في نظم الأسطوانات المكتنزة أن تكون مشكلة. 
وخصوصا عندما يكون النظام الواحد موزعا على عدة أسطوانات. كذلك.لا تكفل 
نظم الأسطوانات المكتنزة التعامل عن بعد ما لم تكن مرتبطة بشبكة. وتسهم كل 
أوجه القصور هذه في الاستعاضة عن تقنيات الأسطوانات المكتنزة بالعنكبوتية 
العالمية» في هذا النوع من نظم استرجاع المعلومات. 
نظم الأسطوانات المكتنزة واسترجاع المعلومات: ' 

لقد سدت نظم الأسطوانات المكتنزة بعض الثغرات» التي لا تغطيها نظم الخط 
المباشر» في استرجاع المعلومات. وذلك بالوصول إلى المستفيد النهائي» وتوفير 
خدمات الاسترجاع لأولئك الذين كان من الممكن لنظم الخط المباشر أن تكون 
بالنسبة هم باهظة التكلفة» ومن الصعب التعامل معها. ولنسبة مئوية عالية من نظم 
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الأسطوانات المكتنزة طبعات مقابلة على الخط SLM‏ على الرغم من أن تغطيتها 
وخصائصها قد لا تكون واحدة. 

ويتم تدريجيا الاستعاضة عن الأسطوانات المكتنزة كوسائط للاختزان» 
بالأسطوانات الرقمية متعذدة الاستخدامات Digital versatile disks (DVD)‏ 
وهي تقنية أسطوانات مكتنزة أكثر حداثة. واعتمادا على طبقتين على كل من سطحيهاء 
تتسع الأسطوانة الرقمية متعددة الاستخدامات لا يبلغ ١1‏ جيجا بايت من المعلومات 
البصرية أو السمعيةء أو أي معلومات أخرى. وبالمقارنة فإن الأسطوانة المكتنزة ^ 
الراهنة بالحجم المادي نفسه» تتسع لأقل من ۷٠١‏ ميجا بايت من المعلومات  (Tech‏ 
Target, 2005(‏ ولا كانت الأسطوانات الرقمية متعددة الاستخدامات تمثل تقنية 
أكثر تطوراء فإنها تحل محل الأسطوانات المكتنزة كوسائط لنظم استرجاع المعلومات 
القابلة للتعامل مع عدة منصات» من أجل المعلومات متعددة الوسائط. أما الوظائف 
الأخرى لنظم الأسطوانات المكتنزة» فتتكفل بها تدريجيا تقنيات العنكبوتية ALI‏ 


الفهارس المتاحة للجمهور على الخط المباشر: الفهارس الإلكترونيية 
للمكتبات كنظم لاسترجاع المعلومات: 

الفهارس المتاحة للجمهور على الخط المباشر PACS‏ فهارس تقليدية محملة على 
وسط (Malinconico, 1984) at‏ وفيا قبل ثانينيات القرن العشرين» م يكن هناك 
سوى بعض الجهود الرائدة» كنظام التحكم في المكتبة Library Control System‏ 
بجامعة ولاية أوهايو State University of Ohio‏ إلا أنه منذ عام ۱۹۸۰ تم تركيب 
نماذج مبدئية» ونظم عاملة للفهارس المتاحة للجمهور على الخط المباشرء في عدد من 
المكتبات» ينمو باطراد (1985 Hildreth,‏ وهناك في أيامنا هذه قليل من المكتبات التي. 
لا يوجد بها فهرس متاح للجمهور على الخط المباشر ضمن نظمها. 
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والفهارس المتاحة للجمهور على الخط المباشر» سواء كانت قائمة بذاتها أو 
جزءا من نظام متكامل لميكنة المكتبات مثل هورايزون Horizon‏ من سرمي داينكس 
SirsiDynix‏ من نتائج ميكنة المكتبات. وقد تم تطوير الفهارس المتاحة للجمهور 
على الخط المباشرء في البداية بواسطة كل من المتعهدين وفرق العمل بالمكتبات. 
وقد توقف الخيار الأخير ولم يعد له وجود» عندما أصبح متعهدو نظم ميكنة 
المكتبات أكثر خبرة واستقراراً. وقد تغيرت واجهات التعامل مع الفهارس المتاحة 
للجمهور على الخط المباشر من لغة الأوامر إلى قوائم الخيارات» وتعبئة الناذج 
والتمثيلات التصويرية. 

وقد قسم هايلدرث )1984( Hildreth‏ الفهارس المتاحة للجمهور على LAI‏ 
المباشر إلى ثلاثة أجيال» ليرسم خريطة تاريخها الحديث» كا يتكهن بتصميمها المحتمل 
في المستقبل. ويحاكي اليل الأول من هذه الفهارس» بشكل أو بآخرء نهج الفهارس 
البطاقية بالنسبة لمحتوى الملف» والتنظيم» والتعامل بالنشبة للبحث عن الأوعية 
المعروفة في المقام الأول. ويضيف الجيل الثاني للفهارس المتاحة للجمهور على الخط 
المباشر تعزيزات في نقاط الوصول الموضوعية؛ وإمكانيات البحث» وجوانب أخرى. 
وتشبه فهارس هذا الجيل نظم الخط المباشر من نواح عدة. أما الجيل الثالث من 
الفهارس المتاحة للجمهور على الخط المباشر» وهو في طريقه الآن OY‏ يصبح حقيقة 
واقعة» فيجعل الفارق بين هذا النوع من الفهارس» ونظم الخط المباشر أقل وضوحاء 
وذلك بتوسعة مدى التعامل؛ فمن الممكن للمستفيد البحث في مراصد البيانات على 
الخط المباشر» والتعامل مع المصادر الأخرى عن طريق الفهرس المتاح للجمهور على 
الخط المباشرء الخاص بالمكتبة المحلية بالنسبة للمستفيد. كذلك تحققت أيضا بعضضن 
التعزيزات الأخرى (كالتكامل بين نمجى بحث النصوص واللغات الطبيعية واللغات 
المقيدة على سبيل المثال) تلك التعزيزات التي اقترحها هايلدرث Hildreth‏ عام 
64 لهذا الجيل من الفهارس» وأصبحت OYI‏ حقيقة واقعة. 
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ويبدو أن ترقيم أجيال الفهارس المتاحة للجمهور على الخط المباشر» قد توقف 
عند الجيل الثالث» وعوضا عن ذلك تكتسب فهارس أخرى تتاح على الخط المباشرء 
تختلف عن تلك الفهارس الخاصة بالأجيال السابقة» أساء ختلفة كفهارس الجيل 
التالي وفهارس القرن الحادي والعشرين» على سبيل (Antelman, Lynema, JEL‏ 
Pace, 2006; Hildreth, 1995; Markey, 2007)‏ &. وقد نشأت فهارس الجيل 
التالي نتيجة لتطويع تنظيم المعلومات واسترجاعها للبيئة الرقمية» وإدخال تقنيات 
استرجاع أثبتت كفاءتها )2006 Antelman, Lynema & Pace,‏ على سبيل 
المثال». وعادة ما تصبح العنكبوتية العالمية المنصة؛ بالنسبة هذا الجيل من الفهارس 
المتاحة للجمهور على الخط SLU‏ الأمر الذي يكفل تحقيق الخصائص المتنوعة التي 
توفرها العنكبوتية؛ فالفهارس من هذا النوع تكفل على سبيل LEU‏ للمستفيدين 
التفاعل مع النظام عن طريق متصفح العنكبوتيةء وواجهة التعامل معها. ومن ثم فإن 
الحاجة لا تدعو لزيد من التعلم لبيئة الاسترجاع هذه بالنسبة لمن يفيدون من 
الفهارس المتاحة للجمهور على الخط المباشرء نظراً لتآلفهم فعلا معها. كذلك يمكن 
إنشاء روابط بالمصادر الأخرى (كالكتب الإلكترونية ومقالات الدوريات مثلا)» من 
تسجيلات الفهرس المتاح للجمهور على الخط المباشرء وذلك لأغراض التعامل 
السلسء بالإضافة إلى الحصول على رؤوس موضوعات بروابط فائقة» في نطاق 
الفهرس المتاح على الخط الباشر» من أجل تعديل عمليات البحث. 

ومن ناحية أخرى دخلت تقنيات الاسترجاع» التي تطورت خصيصا في نظم 
استرجاع الإنترنت» إلى الفهارس المتاحة على الخط المباشرء تلك الأساليب التي 
تتضمن التلقيم المرتد الخاص بالاتصال بالموضوع أو الصلاحية» وترتيب نتائج 
البحث طبقياء والارتقاء بمستوى البيئة الخاصة بالتصفح» ومراجعة هجاء 
استفسارات البحث. Wey‏ ما يتم الاستشهاد بفهرس الخط المباشر الخاص بمكتبات 
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جامعة 5 J| UY‏ كارولينا (www.lib.ncsu.edu/cotalog) North Carolina‏ 
State University Libraries‏ الذي تم تشغيله عام 2٠١١5‏ بوصفه مثالا للجيل 
التالي من الفهارس المتاحة للجمهور على الخط المباشر & (Antelman, Lynema,‏ 
Pace, 2006; Markey, 2007)‏ وينطوي هذا ttl fl‏ من الفهارس المتاحة 
على الخط المباشر» ولاشك» على تحسينات وتعزيزات لم تتوافر في أسلافه. إلا أن كثيرا 
ما تصور ملامحه هايلدرث )1995( Hildreth‏ وماركي )2007( Markey‏ في قوائم 
توقعاتب|ء بالنسبة لمستقبل نظم الفهارس المتاحة على الخط المباشرء لم يتحقق بعد. 
خصائص الفهارس المتاحة للجمهور على الخط المباشر: 

gins‏ التغيرات والتطورات كلا انتقلت الفهارس المتاحة على الخط المباشر 
من جيل إلى آخر. إلا أن هناك خصائص معينة» تبدو فريدة بالنسبة لهذا النوع من 
الفهارس» بوصفها نوعا من نظم استرجاع المعلومات؛ فهذا الضرب من الفهارس 
يشتمل أولا على معلومات وراقية حول موارد المكتبات الخاصة بالمؤسسات ختلفة 
المستويات (المحلية» والإقليمية» والوطنية على سبيل المثال). وعلى الرغم من إنشاء 
فهرس واحد يتاح على الخط المباشر لمكتبة واحدة» في معظم الأحيان» هناك حالات 
أخرى يشتمل فيها فهرس واحد على بيانات موارد عدة مكتبات. وفي مقابل ذلك لا 
تقتصر الأنواع الثلاثة الأخرى من نظم استرجاع المعلومات» في تغطيتهاء على الوثائق 
المتوافرة في مؤسسة واحدة لا أكثر. 

ثانياء يمكن النظر إلى الفهارس المتاحة على الخط المباشر بوصفها امتدادا 
لتسجيلات الفهرسة التي تقر آليا Machine Readable Cataloging‏ (مارك 
(MARC‏ أو أي مواصفة اة للفهرسة) التي عادة Le‏ يتم إعدادها بواسطة 
اختصاصبي المكتبات» باتباع مجموعة من القواعد والمواصفات المعيارية (كخطط 
التصنيف وقواعد الفهرسة على سبيل (JEL‏ لمجتمع المستفيدين الذي تخدمه المكتبة. 
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ولا يمكن ALLL‏ المعلومات في الأنواع الأخرى من نظم استرجاع المعلومات» اتباع 
قواعد توجيهية متطابقة» واضعين في الحسبان مستفيدين مستهدفين بعينهم؛ فديالوج 
colo 9 DIALOG‏ عل سبيل JEM‏ يتسع نظامه المضيف ات من مراصد البيانات. 
ويمكن لكل مرصد للبيانات أن يتم بناؤه وصيانته باستخدام لغة مقيدة ختلفة”. وفي 
الوقت الذي يمكن فيه تحديد معام مجتمع المستفيدين من مكتبة ماء يبدو من الصعب 
التحقق بوضوح ممن يمكن أن يفيد من نظام الخط المباشر» وناهيك عن نظم استرجاع 
الإنترنت. التى تبدو غير قابلة للحصرء دائمة التغير. 

ثالثاء تدعم الفهارس المتاحة للجمهور على الخط SLU‏ الآن على الأقل؛ 
البحث بالحقل (كالمؤلف أو العنوان مثلا) والبحث بالكلات المفتاحية» والبحث 
البوليني» على الرغم من أن المتعاملين مع المكتبات قلا يستخدمون المقومات البولينية» 
للأسباب التي نوقشت في الفصول السابقة. ويشكل البحث عن وثيقة معروفة بعينها 
قطاعا لا يستهان cay‏ من إجالى عمليات البحث في الفهرس المتاح على ا خط المباشرء 
ويرجع ذلك جزثيا إلى أن الفهارس المتاحة على الخط المباشر» من المحتمل أن تغطي 
أوعية ”معروفة بالنسبة للمستفيد» AST‏ من نظم الخط المباشر. أما خصائص البحث 
المتقدم (كالبحث الموزون على شبيل Lep (JEU‏ لا تنوافر عادة بالنسبة للفهارس 
المتاحة للجمهور على الخط المباشرء نظرا OV‏ أداء الاسترجاع المناسبء من الممكن أن 
يتحقق حتى باستخدام إمكانيات البحث الأساس» ويرجع الفضل في ذلك 
لمجموعات المكتبات المحددة تحديدا مناسبا. إلا أنه في يسمى الجيل التالي من 
الفهارس المتاحة للجمهور على الخط المباشر» غالبا ما يحظى التلقيم المرتد الخاص 
بالصلاحية أو بالاتصال بالموضوعء بالدعم عن طريق مثل هذه الروابط الفائقة من 


l Lc )*(‏ على هذه المشكلة» وتيسير مهمة المستفيد» طور ديالوج لغة موحدة للتعامل مع ختلف 
مراصد البيانات» وهي لغة التحكم في المهام (a> All) Job Control Language‏ 
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قبيل ”النتائج الماثلة “. كذلك يمكن للمستفيدين أيضا البحث في حدود نتائجهم 
hae fall‏ للعثور على المزيد من الأوعية المحددة» الأمر الذي يعد إحدى الخواص 
التي أضيفت حديثا لهذا الجيل من نظم الفهارس المتاحة للجمهور على الخط المباشر. 
رابعاء يكفل كثير من فهارس الجيل الراهن للفهارس المتاحة على الخط المباشرء 
الوصول إلى مصادر أخرى» بها في ذلك نظم الخط المباشر. وفي مقابل ذلك لا يمكن 
لنظم الخط المباشر كفالة مثل هذا الضرب من خدمات البوابات «Gateway‏ نظرا 
لطبيعتها الربحية. واعتمادا على زد ۳۹.٠١‏ المواصفة المعيارية الخاصة باسترجاع 
المعلومات من مصادر مختلفة» باستعمال واجهة تعامل موحدة» يمكن للمستفيدين 
البحث في فهارس أخرى متاحة للجمهور على الخط المباشر» في أماكن مختلفة. Sy‏ 
أوضحنا في القسم 5/ ٤ /۲ /١‏ فإن خدمة العنكبوتية للبحث والاسترجاع / Search‏ 
Retrieve Web Service (SRW)‏ والبحث والاسترجاع عن طريق العنوان 
الموحد للمصدر kes SSearch/Retrieve Via URL (SRU)‏ معا أن يجلا محل 
زد YA.O‏ بكفالة مهام وظيفية مماثلة» ولكن بدرجة تعقد أقل )2003 «(Le Van,‏ 


خامساء يشجع تصميم الفهارس المتاحة للجمهور على الخط المباشر على 
التصفح» إذ يمكن لمستخدمي هذه الفهارس ممارسة التصفح» عادة بنقاط الوصول 
كالمؤلف والعنوان مثلاء (ay‏ تقدم الأنواع الأخرى من نظم استرجاع المعلومات» 
النتائج مرتبة زمنيا أو وفقا للترتيب الطبقي للصلاحية أو الاتصال بال موضوع. 
والتصفح برقم الطلب في الفهارس المتاحة للجمهور على الخط المباشر» مفيد على وجه 
ا لخصوص بالنسبة للمستفيد» نظرا لأن ترتيب عرض النتائج» يشبه إلى حد بعيده 
الترتيب المادي لمجموعات المكتبات على الأرفف. ومن ثم» فإن المستفيدين من 
الفهارس المتاحة على الخط المباشر تناح لهم فرصة العثور على الأوعية المنصلة 
موضوعيا بجوار بعضها البعض على الأرفف» قبل التوجه إلى الأرفف بأنفسهم. 
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غير أن الفهارس المتاحة للجمهور على الخط المباشر لا يزال من الصعب 
التعامل معهاء على الرغم من أن معظم هذه الفهارس ينتمي إلى الجيل الثالث. ويرجع 
Borgman (1986, 1996) ole)‏ النتيجة النهائية هذه إلى تصميم هذه الفهارس 
الذي لم ينجح في استيعاب الدروس المستفادة من دراسات استرجاع ا معلومات» وإلى 
الفهم القاصر لسلوك البحث. ولا يزال افتراض قدرة المستفيدين» بلا تدريب» على 
التعامل مع الفهارس المتاحة للجمهور على الخط المباشر (1988 (Hildreth,‏ مفتقرا 
عقن Kool SON‏ 


لقد أصبحت الفهارس المتاحة للجمهور على الخط SLU‏ درة التاج في نظم 
استرجاع المعلومات. led‏ بين بدايات ثمانينيات القرن العشرين وتسعينيات القرن 
نفسه» عندما كانت تقارن بالفهارس البطاقية» ونظم الخط المباشر» التي يتم التعامل 
معها مقابل رسوم. وتبدو صلاحية هذه الفهارس في تراجع مطرد» نتيجة لنشأة نظم 
استرجاع الإنترنت» وارتفاع مستوى كفاءاء» من حيث القدرات الاسترجاعية 
aed, Eii‏ ويعبر الإنتاج الفكري الذي صدر بعد العصر الذهبي 
للفهارس المتاحة للجمهور على الفط e ALM‏ عن مخاوف حقيقية بشأن وضعها 
الراهن وظروفها المستقبلية» بين) جوجل Google‏ نظام استرجاع الإنترنت الذي 
تتزايد شعبيته» لا يحكم سيطرته على البحث في العنكبوتية العالمية فحسبه Lady‏ 
يتوسع في خدماته أيضا إلى ما وراء ذلك (مثل جوجل للبحث عن الكتب Google‏ 
Book Search‏ وجرجل العالم (Google Scholar‏ ويبدو نجاح جوجل في البحث 
في العنكبوتية العالميةء بالإضافة إلى توسعه في نطاق نفوذ الفهارس المتاحة على L‏ 
المباشرء المصدر الرئيس لمثل هذه المخاوف )2007 .(Marcum, 2006; Markey,‏ 
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الفهارس المتاحة للجمهور على الخط المباشر واسترجاع المعلومات: 

لقد أثير التساؤل حول ما إذا كانت الفهارس المتاحة للجمهور على Sed)‏ 
المباشر» فهارس مكتبات أم نظم استرجاع معلومات على LAI‏ المباشرء في الماضي 
(Hildreth, 1985)‏ ويمكن للإجابة عن هذا التساؤل OV‏ أن تكون الفهارس 
المتاحة على الخط المباشر نظم استرجاع معلومات بسماتها الخاصة؛ لقد كانت الفهارس 
المتاحة على الخط المباشر تساعد المستفيدين في العثور على الأوعية في مجموعات 
المكتبات» وتفيد من الؤظائف التي لم تتوافر في أسلافها من الفهارس البطاقية. وفضلا 
عن ذلك تقوم الفهارس المتاحة للجمهور على الخط المباشر مقام البوابات التي تفضي 
إلى النظم الأخرى لاسترجاع المعلومات» بتوفير مقومات الارتباط بها. ولما كانت 
المنفردات monographs‏ هي الفئة الرئيسة لمجموعات المكتبات» فإن الفهارس 
المتاحة على الخط المباشر» هي أداة الاسترجاع الرئيسة» إن لم تكن الوحيدة للوصول 
إلى هذه المنفردات. وبدون الفهارس المتاحة على الخط المباشرء يمكن لمجموعات 
المكتبات أن يكون من الصعب الوصول إليها في هذا العصر الرقمي» نظرا لأن الأنواع 
الأخرى من نظم استرجاع المعلومات لم تصمم خصيصا لذلك الهدف. 

لقد غيرت نشأة خدمة جوجل للبحث عن الكتب «Google Book Search‏ 
كما سبق أن ذكرناء بل Lal‏ تحدت فعلا الدور المسيطر الذي تنهض به الفهارس المتاحة 
على الخط المباشر» في العثور على معلومات الكتب. وقد بدأت خذمة جوجل للبحث 
عن الكتب» التي كانت تسمى في البداية مطبوعات جوجل Google Print‏ عام. 
AERE‏ لصالح مجموعة من الناشرين (مثل Blackwell, Cambridge‏ 
(University Press, the University of Chicago Press‏ وبعد شهرين 
امتدت لمكتبات في عدة مؤسسات (مثل Harvard, University of Michigan,‏ 
(New. York Public Library, Oxford, and Stanford‏ وذلك كمشروع 
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جوجل للمكتبات (Google, 2008a)‏ ومنذ ذلك الحين وأعداد المشاركين في هذا 
المشروع في تزايد مطرد. والكتب التي يشملها هذا المشروع قابلة للبحث بعد رقمنتها. 
وفضلا عن ذلك تتوافر في خدمة جوجل للبحث عن الكتب» خواص كالربط 
بمراجعات الكتب Book reviews‏ والمصادر التي تستشهد بالكتب (كصفحات 
العنكبوتية العالمية) الخاصة بالكتاب الذي يتم البحث عنه. وما لاشك فيه أن خدمة 
جوجل للبحث عن الكتب» تيسر استرجاع معلومات الكتب» بنهج BLE‏ عن 
طريقة الفهارس المتاحة على الخط المباشر. كذلك تدعو خدمة جوجل للبحث عن 
الكتب» إلى جانب نظامه الخاص بالبحث في العنكبوتية» الفهارس المتاحة على الط 
المباشرء OY‏ تعيد النظر في موقفها ووظائفهاء وأدائها.في هذا العصر الرقمي لاسترجاع 
(Marcum, 2006) >L lall‏ 


نظم استرجاع الإنترنت: أحدث أعضاء أسرة نظم استرجاع المعلومات: 

يكفل النمو الأسي للإنترنت» للمتعاملين معها القدرة على الوصول إلى كميات 
هائلة من المعلومات الرقمية» بصرف النظر عن الزمان والمكان. كذلك تتضح في 
الوقت نفسه. الحاجة إلى المزيد من نظم استرجاع المعلومات؛ من أجل استرجاع أي 
”إبر“ بعينها من ”كومة تبن“ الإنترنت. ومن ثم طور الأفراد والشركات» 
وا لمؤسسات عددا كبيرا من نظم استرجاع الإنترنت» أو نظم استرجاع المعلومنات 
الخاصة بالإنترنت». للتغلب على مشكلة تفجر المعلومات على الإنترنت. 

وكا هو معروف» فإن عبارةمحرك البحث في العنكبوتية web search‏ 
engine‏ أو رك البحث search engine‏ يبساطة» يبدو الاسم الأكثر شيوعامن 
نظم استرجاع الإنترنت» عند الإشارة إلى النظم الخاصة باسترجاع المعلومات من 
الإنترنت» إلا أن هذا الكتاب يستعمل المصطلح الأخير» نظرا لأن الأول يبدو ضيقا 
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جدا في معناه. فالعنكبوتيةء أولاء أجد التطبيقات لا أكثر» حتى وإن كانت التطبيق 
المسيطر في الإنترنت. كما أن المعلومات المتداولة من جانب التطبيقات الأخرى» 
كبروتوكول نقل الملفات (ETP)‏ تدخل أيضا في نطاق نظم استرجاع الإنترنت. وسن 
ثم» فإن تسمية نظم استرجاع الإنترنت بمحركات البحث في العنكبوتية» يمكن أن 
تعني ضمنا نها تتعامل مع المعلومات المتوافرة في العنكبوتية فقط» وتستبعد le gall‏ 
الناشئة عن التطبيقات الأخرى للإنترنت. ثانياء لبعض تطبيقات الإنترنت مقومات 
البحث الخاصة بها (مثل آرثى Archie‏ بالنسبة لمعلومات بروتوكول نقل LA‏ 
(ETP‏ وإن OLS‏ كثير ENE‏ التطبيقات قد توقف تدريجياء أو بدأ استعمال 
العنكبوتية كمنصة. ثالثاء يمكن لأدوات استرجاع الإنترنت أن تكون معتمدة على 
الأدلة directory-based‏ (مثل ياهو!) أو معتمدة على البحث search-based‏ 
(مثل آلتافيستا (AltaVista‏ ومن ثم» فإنه قد يكون من غير الملائم الإشارة إلى نظم 
استرجاع الإنترنت المعتمدة على الأدلة» بوضفها محركات بحث في العنكبوتية؛ OV‏ 
البحث لم يكن يحظى بالدعم في تصميمها الأصلي. والمكون الخاص بالبحث المتاح 
الآن في كثير من نظم استرجاع الإنترنت المعتمدة على الأدلة» ناتج عن الاتحاد بين 
النوعين المختلفين من النظم» LS‏ سنوضح في بعد. 

وسوف نقدم في هذا الكتاب معلومات حول نظم استرجاع الإنترنت» أكثر 
من تلك التي نقدمها حول الأنواع الأخرى من نظم استرجاع المعلومات» لسببين؛ 
[sl‏ أن نظم استرجاع الإنترنت أحدث من نظم أخرى أعضاء في أسرة نظم 
استرجاع المعلومات. والسبب الثاني أن النظم الأخرى قد تمت دراستها بعمق» من 
جانب كثير من الباحثين على مر السنين (كنظم الخط المباشر من جانب هارتر 
TER ‘Harter, 1986‏ وتد» وهارتلي 9 tLarge, Teded, & Hartley,‏ 
وميدو» وبويسء وكرافت 1999 ‘Meadow, Boyce, & Kraft,‏ وووكر وجینز 
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‘Walker & Janes, 1999‏ ونظم الأسطوانات المكتنزة «CD-ROM systems‏ 
من جانب شودري 1999 ‘Chowdhury,‏ وراولي وسلاك Rowley & Slack,‏ 
7:؛ والفهارس المتاحة على الخط المباشر OPACS‏ من جانب بوليو وبورجمان 
‘Beauliew & Borgman, 1996‏ وهايلدرث 1985 (Hildreth,‏ إلا أن نظم 

استرجاع الإإنترنت» لم تحظ بعد بالمعالجة على نحو منهجي شامل. 


فئات نظم استرجاع الإنترنت: 

تتوافر نظم استرجاع الإنترنت» على الرغم من حداثة عهدهاء بأعداد ضخمة 
وفئات متنوعة. ولم يكن من الممكن إحصاء المتاح من نظم استرجاع الإنترنت المتاحة 
على الإنترنت» نظرا oY‏ هذه النظم بدأت تتزايد في منتتصف تسعينيات القرن 
العشرين. إلا أن التقسيم الفئوي لنظم استرجاع الإنترنت» بناء على ما يلي من معايير» 
يقصد به إلقاء نظرة شاملة على أحدث أعضاء أسرة استرجاع المعلومات. 
التصنيف وفقا لنهج الاسترجاع: 

البحث والتصفح هما النهجان الرئيسان للاسترجاع» اللذان حظيا بالمعالجة في 
الفصل السادس. وعلى الإنترنت» تسمى نظم الاسترجاع القائمة على البحث 
بمحركات البحث (مثل التافيستا وجوجل) len‏ تسمى نظم استرجاع المعلومات 
القائمة على التصفح بالأدلة (مثل ياهو!). وغالبا ما تسمى الأدلة أيضا بالفهارس. 
وتكفل محركات البحث للمستفيدين فرصة صياغة أو تكوين استفساراتهم الخاصة 
بالبحث. وفي مقابل ذلك تنظم الأدلة» وتقدم موارد الشبكة تحت فئات منظمة هرميا. 
وبإمكان من يستخدمون نظم استرجاع الإنترنت القائمة على الأدلة» العثور على 
المعلومات باتباع مساز محدد سلفاء أي هرم الفئات الذي يوضع للنظام. 
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وكا بيناني الفصل السادس» OLS‏ لكل من البحث والتضفح كنهجين 
للاسترجاع» ما يكتنفه من قصور؛ فاستفسارات البحث» على سبيل المثال» من 
الصعب صياغتهاء إلا أنها لا غنى عنها في نظم استرجاع الإنترنت القائمة على 
البحث. وعلى المستفيدين من الإنترنت صياغة استفساراتهم» نظرا ON‏ اختصاصيي 
المقلوماتة لا يعملوق dale‏ كوسطاء ف هذه fey Rtg‏ التو hts‏ يمك a‏ 
النتائج المسترجعة من الإنترنت: بالنسبة لمعظم الموضوعات» أن يتجاوز ببساطة 
الآلاف» إن لم يكن الملايين. إلا أن التصفح كنهج للاسترجاع» لا تتوافر له تقنية أو 
وسيلة لتضييق استفسار الاسترجاع. ومن ثم» فإن نظم استرجاع الإنترنت تحاول 
التغلب على مثل هذه المشكلات» بدعم كل من التصفح والبحث في الوقت نفسه. 
وتستخدم نظم استرجاع الإنترنت» القائمة على الأدلةء للسماح أو الترخيص 
لمحركات البحث بتوفير مقومات البحث على مواقعها. كذلك أيضا تعاقدت نظم 
استرجاع الإنترنت» القائمة على البحث» مع مرافق أو خدمات الأدلة لتوفير خيار 
التصفح في مواقعها. إلا أن الشراكات بين هذين الضربين من نظم استرجاع الإنترنت 
تتغير باستمرار» وأصبحت في نهاية الأمر لا معنى lb‏ عندما بدأ كبار الضالعين في هذا 
المجال» تطوير كل من محركات البحث والأدلة لنظمهم الخاصة في الوقت نفسه. 

ويسفر الجمع بين التصفح والبحث في أي من المواقع» عن النوع الثالث من 
نظم استرجاع الإنترنت. أي النظم الحجين لاسترجاع الإنترنت. وبإمكان المستفيد في 
بيئة لهجين هذه البحث أو التصفح في الموقع نفسه دون الانتقال إلى آخر. وقد ترتب 
على ذلك ارتفاع مستوى فاعلية الاسترجاع. 
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التصنيف تبعا للتطبيق: 

تطورت. منذ نشأة الإنترنت» الكثير من التطبيقات المختلفة: تلنت telnet‏ 
وبروتوكول نقل الملفات FTP‏ والجوفر gopher‏ وندل المعلومات:واسعة المدى 
Wide area information servers (WAISs)‏ والعنكبوتية أو العنكبوتية 
العالمية World Wide Web‏ وهذا قليل من كثير. ويقوم كل واحد من هذه 
التطبيقات بإنجاز مهام معينة؛ فتلنت» على سبيل المثال» للارتباط من مسافة نائية» من 
نظام محلي» بحيث يمكن استغلال المقومات أو الموارد (كالعتاد والبرمجيات مثلا) 
القائمة في الموقع النائي. أما بروتوكول نقل الملفات FTP‏ فيستخدم من أجل نقل 
الملفات» فيا بين النظم النائية والنظم المحلية بسلاسة وبسرعة عالية. والعنكبوتية 
Web‏ هي أكبر مستودع للمعلومات على الإنترنت» نظرا لواجهة التعامل الخاصة بهاء 
التي تراعي ظروف المستفيدين أو تتعاطف معهم» فضلا عن خاصية الوسائط الفائقة. 
وكان الجوفر» كتطبيق عاطل اليوم؛ إذ حلت عله العنكبوتية تماماء مصم| لاختزان 
وإسترجاع المصادر على الإنترنت» اعتمادا على واجهة تعامل عبارة على قائمة خيارات 
فائقة. ومن ناحية أخرى» كانت ندل المعلومات واسعة المدى أداة ببحث بالكلمات 
.المفتاحية في مصادر الإنترنت» متوافقة مع المواصفة المعيارية زد YA.O t‏ وفي مرحلة 
أو أخرى» كانت نظم الاسترجاع يتم بناؤها من أجل كل هذه التطبيقات» فيا عدا 
ندل المعلومات واسعة المدى WAIS‏ نظرا OY‏ هذا التطبيق الأخير OLS‏ يتكون 
في حد ذاته:من تقنية للاسترجاع. ويشتمل الجدول رقم V/A‏ على نظم الاسترجاع 
التي نشأت من أجل التطبيقات الرئيسة للإنترنت» بناء على :بجي الاسترجاع 


+*+ 


x ختلفين”‎ ١ 


(*) تلنت بروتوكول للشبكات» تطور عام 2١1479‏ يستخدم في الإنترنت أو الشبكات المحلية» لتوفير 
مقومات التواصل التفاعلي القائم على النصوصء ثنائي EYI‏ اعتمادا على منفذ افتراضي. (المترجم) 

(**) للتعرف على مثل هذه التطبيقيات للإنترنت» الجاري منها والعاطل» يمكن الاطلاع على مقالة 
تصور واقع الإنترنت حتى منتصف تسعينيات القرن العشرين: حشمت قاسم. الونترنت 
ومستقبل خدمات المعلومات. دراسات عربية في المكتبات وعلم المعلومات» -NIAT Ye‏ ص- 
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الجدول رقم ١/۸‏ تطبيقات الإنترنت وما يقابلها من نظم الاسترجاع 


ne 
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Gopher Jewels (Y) Veronica, Jughead (1) 


وكا يتضح من الجحدول رقم ۸/ »١‏ فإن نظم استرجاع الإنترنت تشمل أكثر من 
جرد محركات للبحث في العنكبوتية. وعلى الرغم من أن كشيرا من نظم الاسترجاع 
الواردة في الجدول رقم ۸/ ١‏ لم يعد لها وجود اليوم» فإنها كانت تنهض بدور متميز في 
استرجاع المعلومات من الإنترنت» وخصوصا قبل أن تتطور نظم استرجاع الإنترنت 
aie‏ العنكبوتية. ولمزيد من التحديدء فإن الهايتلنت” Hytelnet‏ كانت تقدم 
قائمة تضم كثيرا من مصادر التلنت عن طريق واجهة تعامل نصوص فائقة. WAS‏ 


حص .۸۸-٤٤‏ وأعيد نشر هذه المقالة في: حشمت قاسم. الاتصال العلمي في البيئة 
الإلكترونية. القاهرة» دار غريب» .7٠٠6‏ ص ص ٤٦١-٤١۷‏ . 

() المايتلنت محاولة مبكرة لتصميم واجهة تعامل dale‏ أو بسيطة على الأقل» تتعامل مع ALE‏ 
مصادر المعلومات المعتمدة على تلنت» التى كانت متاحة قبل العنكبوتية العالمية. وكانت 
الحايتلنت تكفل لن يتعاملون معها واجهة تعامل تصويرية GUI‏ تتيح فرصة تصفح دليل 
المصادر القائمة على تلنت» والوصول إليها على نحو معياري نسبيا. (المترجم) 
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كانت تكفل عمليات الربط الآلي للمواقع الواردة في القائمة. أما آر 3< Archie.‏ 
الذي قام بتطويره ألن إمتيج Alan Emtage‏ عندما كان طالبا في الدراسات العليا 
بجامعة ماجل MeGIN‏ بكنداء فكان يقوم دوريا بمسح مضيفي بروتوكول نقل 
الملفات FTP‏ مجهولي الاسم وتجميع المعلومات (كاسم المضيف» واسم الدليل» 
وحجم الملف على سبيل المثال) وذلك بالنسبة للملفات المتاحة في تلك النظم المضيفة. 
وكان بإمكان المستفيدين البحث في الملفات ”القابلة للنقل بواسطة بروتوكول نقل 
الملفات“ باسم المضيف» واسم الدليل» واسم الماف» وذلك باستخدام آر شي. وكان 
الجوفر يتمتع بشهرة كبيرة قبل أن تصبح العنكبوتية هي نجم التطبيقات على 
الإنترنت. ولم يعد هناك الآن وجود على الإنترنت» لنظم الاسترجاع التي صممت 
لمعلومات الجوفر» وهي فيرونيكا «Veronica‏ وجاجهيد Jughead‏ وجواهر الجوفر 
Gh per Jewels‏ ؛ إذ توارى الجوفر تماما من الإنترنت. أما فترة حياة ندل المعلومات 
واسعة المدى WAIS‏ فكانت قصيرة نسبياء ويرجع ذلك جزئيا إلى واجهة التعامل 
الخاصة بهاء التي كانت تعتمد على لغة الأوامر» وكذلك ظهور نظم استرجاع 
الإنترنت القائمة على العنكبوتية. إلا أن واجهة التعامل الموحدةء والمواصفة المعيارية 
زد ۳۹.٠١‏ المستقلة عن المنصةء التي تم تطبيقها في ندل المعلومات واسعة المدى» 
كانت تستخدم في كثير من تطبيقات الاسترجاع الأخرى (كالفهارس المتاحة على 
الخط المباشر على سبيل المثال). 

وقد تم استيعاب قطاعات من مهام الاسترجاع التي كان يتم إنجازها من قبل 
بواسطة نظم لا تعتمد على العنكبوتية» كآرشي على سبيل المثال؛ في النظم القائمة على 
العنكبوتية. ولم تعد نظم الاسترجاع الأخرى غير القائمة على العنكبوتية (مثل 


C)‏ أداة لتكشيف أرشيفات بروتوكول نقل الملفات FTP‏ تكفل للمتعاملين معها العثور على 
ملفات بعينها. وتعد بمثابة أول محرك للبحث في الإنترنت. (المترجم) 
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فيرونيكا (Veronica‏ متاحة الآن» نظرا OV‏ رسالتها الاسترجاعية قد تحققت. ومن 
الممكن أيضا استرجاع المعلومات» التي ترد من مشل هذه التطبيقات الخاصة 
بالإنترنت» مثل يوزنت Usenet‏ (بالنسبة للمناقشات التي تدور بين أطراف 
متعددة» حول موضوعات متعددة) والقوائم lists‏ (الخاصة بالمناقشات التي تدور بين 
طرف واحد» وأطراف متعددة حول موضوعات متتقاة) قابلة للاسترجاع أيضا عن 
طريق نظم الاسترجاع القائمة على العنكبوتية العامة (مشل جوجل في 
cgroups.google.com‏ بالنسبة لمعلومات اليوزنت) أو نظم الاستر جاع المحددة 
(مثل Tile.net at tile.net/lists‏ بالنسبة لمعلومات القوائم). 


وقصارى القول» فإن نظم استرجاع الإنترنت في الوقت الراهن» تعتمد جميعها 
على العنكبوتية» أو تستخدم العنكبوتية كمنصة. وتغطي نظم الاسترجاع هذه 
المعلومات التي ترد من العنكبوتية» والتطبيقات الأخرى (مثل بروتوكول نقل الملفات 
FTP‏ ويوزنت (Usenet‏ حتى ly‏ كانت العنكبوتية هي الآن أكبر مستودع 
للمعلومات على الإنترنت. 
التصنيف وفقا للمحتوى: 

من الممكن أيضا تقسيم نظم استرجاع الإنترنت إلى فئات» وفقا لمحتوى 
المعلومات التي تغطيها. فبعض هذه النظم يحرص على التغطية الشاملة (مثل جوجل) 
وذلك بتجميع المعلومات من مختلف المصادر والمجالات الموضوعية. وفي مقابل ذلك 
يمكن لنظم أخرى أن يتم بناؤها من أجل SLE‏ واحد فقط بعينه. ومن أمثلة مثل هذه 
النظم بوابةالموادالتربوية Gateway for Educational Materials‏ 
AJL (www.thegateway.org)‏ للتربية. 


(*) یوزنت» نظام لا مركزي عالمي للمناقشات في الإنترنت» نشأت فکرته عام ۱۹۷۹ء وتطور فعلا 
عام ٠‏ (المترجم) 
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وقد تطورت بعض نظم استرجاع الإنترنت إلى مرافئ cportals‏ بامتداد تغطية 
المحتوى إلى حارج نطاق المعلومات القابلة للبحث فيها. إلا أن البحث يظل هو البؤرة 
في المرافئ. والمرافئ الرأسية أو المتخصصة vortals‏ في مقابل ALIS‏ مرافئ تقتصر 
على قطاع رأسي (كالرعاية الصحية» أو التأمين» أو السيارات أو الصناعات الغذائية)؛ 
فالمجال أو القطاع أو السوق رأسي» لأنه يركز على نطاق ضيق نسبيا من السلع 
والخدمات» بين| السوق الأفقية هي تلك التي تهدف إلى إنتاج نطاق واسع من 
المنتجات والخدمات )2007 (Tech Target,‏ ويمكن القول بوجه eple‏ إنه من 
الممكن النظر إلى المرافئ بوصفها نظا عامة لاسترجاع الإنترنت. أما المرافئ الرأسية 
من ناحية أخرى» فنظم متخصصة لاسترجاع معلومات الإنترنت» موجهة نحو سوق 
رأسية. وكل من المرافئ والمرافئ الرأسية أو التخصصية» نظم هجين لاسترجاع 
معلومات الإنترنت» تدعم كلا من التصفح والبحث. 
وبالإضافة إلى ذلك» هناك نظم الاسترجاع المكرسة لاسترجاع أنواع بعينها من 
المعلومات على الإنترنت. فأر els‏ الهاتف Phone Number (www.phone‏ 
nnumber.com)‏ على سبيل JE‏ نظام يمكن أن يستخدم للحصول على العناوين 
البريدية وأرقام الهواتف. Laf‏ مابكويست «Map Qest (www.mapquest.com)‏ 
كفل عل شيل le Art ie OM‏ موا بجي جاح aa u‏ 
تفاعلية لذلك العنوان. 
ويوضح هذا التصنيف الهرمي لنظم استرجاع الإنترنت» تنوع وقدرات نظم 
استرجاع المعلومات التي تطورت على مر السنين. وكا يبدو» فإن نظم استرجاع 
اله ا وة تطروت واف ly ews‏ ةن اة 
استرجاع المعلومات. 


293 


خصائص نظم استرجاع الإنترنت: 

لم يتم تصميم نظم استرجاع الإنترنت» وخصوصا محركات وأدلة البحث في 
العنكبوتية» باستثناء وايز WAIS‏ [ندل المعلومات واسعة المدى] بوصفها جزءا من 
جهود تطوير الإنترنت» وإنها نشأت هذه النظم بوصفها استدراكاء عندما كان 
المستفيدون من الإنترنت» وهم يواجهون كميات هائلة من المعلومات غير المجهزة» 
يفتقدون أي أداة لأغراض الاسترجاع؛ فآرشي Archie‏ على سبيل SUN‏ قد تطور 
عندما كان المتعاملون مع بروتوكول نقل الملفات» يرغبون في معرفة ما إذا كانت أي 
مواقع مجهولة لبروتوكول نقل الملفات تستضيف المعلومات التي كانوا يحتاجون إليها. 
وقد صممت محركات وأدلة البحث في العنكبوتية» بعد أن واجه المستفيدون من 
العنكبوتية صعوبات متزايدة في العثور على ما كانوا يريدونه» بمجرد تتبع الروابط 
الفائقة الكامنة في مواقع العنكبوتية. ولو أن العنكبوتية برمتها عوملت بوصفها مكتبةء 
لكان من الممكن للموقف أن يكون WG‏ للمقارنة بالحصول على يحموعات المكتبة» 
قبل إنشاء الفهرس الخاص be‏ وتختلف نظم استرجاع الإنترنت» عن الأنواع الأخرى 
لنظم استرجاع المعلومات» في عدة أوجه أخرى إضافية نناقشها في الأقسام التالية. 
التغطية والمعلومات المصدرية: 


تمر أي معلومات» قبل أن تدخل في نظم الخط المباشر أو الفهارس المتاحة على 
ا خط المباشرء lem‏ عبر التحرير والتحكيم أو أي إجراءات مراجعة ALU‏ لضان 
جودتها. إلا أن هناك قليلا من تدابير ضبط الجودة في عملية إنتاج المعلومات على 
الإنترنت؛ فبإمكان أي إنسان وضع أي معلومات على الإنترنت» دون مراجعتها من 
منظور الجودة أو مدى الملاءمة. ويمكن للمعلومات من هذا النوع» أن تصبح 
المعلومات المصدرية بالنسبة لنظم استرجاع الإنترنت. 
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وتعتمد نظم استرجاع الإنترنت. في المقام الأول» على وسائل slam‏ 
harvesting‏ آلية» كالشواخص الآلية robots‏ أو العناكب spiders‏ أو الزواحف 
5 لتجميع المعلومات من الإنترنت. كذلك تكفل هذه النظم للبشر تقديم 
المعلومات حول مواقعهم الخاصة» وإن كانت المعلومات التي تقدم ذاتياء لا تشكل 
سوى نسبة ضئيلة من إجمالى المعلومات التي يتم تجميعها. وفيما عدا نظم استرجاع 
الإنترنت القائمة على الأدلةء فإنه يبدو من النادر أن نجد بشرا يختارون يدوياء 
معلومات من الإنترنت. وفي مقابل ذلك يتحمل اختصاصيو المعلومات مسئولية 
عملية تجميع البيانات في الأنواع الأخرى من بيئات الاسترجاع. 

وعندما يتم إرسال أو إطلاق الشخوص الآلية أو العناكب» أو ما شابه ذلك» 
لتجميع البيانات» فإنها ليست جميعها مصممة لاستنساخ محتوى المواقع كاملة؛ فآرشي 
Archie‏ على سبيل المثال» كان يستنسخ فقط معلومات الدليل الخاصة بمواقع 
بروتوكول نقل الملفات. وتلتقط بعض وسائل الحصاد الكلمات المثتين الأولى أو 
الأسطر العشرين الأولى» من كل موقع تقوم بزيارته. وتحصل وسائل أخرى على 
معلومات معينة فقط (كالعنوان» والرؤوس والروابط الفائقة على سبيل (SLE‏ من 
المواقع. وبالإضافة إلى ALIS‏ فإن لمواقع العنكبوتية» بوصفها أكبر مستودع 
للمعلومات على الإنترنت» هياكلها الفائقة المتشابكة. وقليل من نظم استرجاع 
الإنترنت» ما يقصد أو تتوافر له المصادر aod‏ المعلومات من كل وثيقة مرتبطة برابطة 
فائقة؛ فمن الممكن» على سبيل المثال» للبعض أن يقرر استنساخ الوثائق بناء على 
مستوى معين واحد للروابط الفائقة» تاركا المعلومات على المستويات الأخرى دون 
مساس. ومن ثم» فإنه بالنسبة لمعظم المواقع» لا تشتمل نظم استرجاع الونترنت سوى 
على جزء فقط من Lele gles‏ الكاملة. 
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وبالإضافة إلى العاملين اللذين عرضنا لما تواء فإن لما يسمى العنكبوتية الخفية 
أو غير المرئية invisible‏ تأثيرها على تغطية نظم استرجاع الإنترنت. وتدل العنكبوتية 
الخفية على تلك المكونات التي لا يمكن الوصول إليها بواسطة النظم العامة أو 
المشتركة لاسترجاع الإنترنت» نظرا لصيغ الملفات (مثل الصور الناشئة عن استخدام 
الحاسب (Computer generated imagery CGI‏ أو اھیاکل structures‏ (مشل 
مراصد البيانات المحملة على العنكبوتية). ولم تكن ملفات صيغ الوثائق متعددة 
المنصات Portable Document Format (PDF)‏ على الإنترنت» تحظى بالتغطمة 
من جانب أي نظام لاسترجاع الإنترنت» حتى غير جوجل من مارساته» في مطلع عام 
١‏ لكي يستوعب هذه الملفات. 

وبناء على دراسات أجراها لورانس وجايلز ,1998( Laurence and Giles‏ 
)1999 فإن تغطية نظم استرجاع الإنترنت» بالنسبة للحجم المقدر للعنكبوتية القابل 
للتكشيف على الصعيد العام (أي ۸٠١‏ مليون صفحة في فبراير عام )۱۹۹٩۹‏ قد 
تراجعت على نحو cb goula‏ منذ ديسمبر عام 4817 ١؛‏ إذ لم يكن أي نظام يكشف أكثر 
من حوالي ٠١‏ بالمئة من الحجم المقدر للعنكبوتية القابلة للتكشيف على الصعيد العام. 
dy‏ عام ۱۹۹۷ كانت نسبة التغطية حوالي ۳۳ بالمئة. وقد تم استخلاص النتائج 
النهائية بعد أن فحص الباحثون ستة من نظم استرجاع الإنترنت. في إحدى 
الدراسات» وأحد te‏ نظاما في أخرى» اعتتمادا على استفسارات حقيقية» أجراها 
العاملون في معهد بحوث إن إي سي NEC‏ وقد قدر آخرون (مثل Smith,‏ 


(*) إن إي سي» شركة يابانية عابرة للبحار» تقوم بتوريد خدمات ومنتجات تقنيات المعلومات 
والحلول الشبكية للمشروعات التجاريةء ومتعهدي خدمات الاتصالات والأجهزة الحكومية» 
ومقرها الرئيس في ميناتو Minato‏ أحد أحياء طوكيو باليابان. وكانت تعرف قبل عام ۱۹۸۳ 
باسم شركة نيبون للكهرباء „Nippon Electric Company‏ (المترجم) 


296 


0 أن نظم استرجاع الإنترنت التي تتربع على القمة» لم تستطع تكشيف ما بين ٠١‏ 
إلى VO‏ بالمئة من صفحات العنكبوتية. 

وأيا كانت التغطية الفعلية» فإن ما يبدو جلياء أن نظم استرجاع الإنترنت لا 
تستطيع سوى تجهيز نسبة متناقصة من معلومات الإنترنت» نظرا لأن الإنترنت تنمو 
أسيا. وتميز التغطية غير المكتملة للمعلومات» والممارسات غير الانتقائية للمعلومات 
المصدرية» نظم استرجاع الإنترنت» عم يقابلها في البينات الأخرى 
لاسترجاع المعلومات. 
تقنية التكشيف: 

خوارزميات التكشيف DY‏ القائمة على إحصاء تكرار الكلمات والمعايير 
المماثلة» هي الغالبة في مارسات التكشيف. في إنشاء نظم استرجاع الإنترنت. ويتطلب 
الأمر تدخلا بشريا محدودا في عملية التكشيف» حتى وإن كانت بعض النظم (ياهو! 
على سبيل المثال) تجنح إلى تقسيم المعلومات التي تشملها مراصد بياناتهاء إلى LS‏ 
يدويا. ونادرا ما تستخدم اللغات المقيدة في تكشيف محتوى العنكبوتية؛ مراعاة 
لعوامل كالتكلفة» والفاعلية» وطبيعة المعلومات على الإنترنت. 

وهناك بعض المشروعات (مثل إنتيوت (www.intute.ac.ukintute at‏ 
' التي تستعمل لغات مقيدة لتنظيم مصادر الإنترنت. ومن الممكن العثور على قائمة 
بالمشروعات الماثلة في سابيرستاكس Cyberstacks‏ وهو دليل افتراضي يعتمد على 
العنكبوتية» لكثير من المشروعات وثيقة الصلة بالمكتبات وعلم المعلومات 
.(McKiernan, 2001)‏ إلا أن هذه المشروعات. إذا أردنا الدقة والتحديد؛ إنما هي 
بمثابة فهارس متاحة على الخط المباشر» بالنسبة لمصادر الإنترنت» أكثر منها نظا 
لاسترجاع الإنترنت» نظرا لكثافة التدخل البشري فيها. 
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ويتم التحقق من حقول (كالمؤلف Ol gill y‏ وسنة النشر على سبيل (JUM‏ 
وتكشيفهاء عند بناء مراصد البيانات لنظم الخط المباشر ونظم الفهارس المتاحة على 
الخط المباشر. وفي مقابل ذلك لا تتكون نظم استرجاع الإنترنت من حقول بيانات 
بالمفهوم التقليدي» في مراصد بياناتباء حلاف الملفات الكشفية الخاصة بالكلمات 
المفتاحية والأماكن التي تقابلها في النظام» بلا حقول. ومن الممكن معاملة المعلومات 
المميزة tagged‏ مثل </title> <title>...‏ في لغة ترميز النصوص الفائقة 
(HTML)‏ أو </price> <price>..‏ في لغة الترميز القابلة للاتساع (XML)‏ عل 
أقصى تقدير» بوصفها أشباه حقولٍ quasi fields‏ نظرا لأنها لا يتم تحديدها بطريقة 
موحدة في أثناء عملية التكشيف. 

وقصارى القول» فإن تقنية التكشيف بالنسبة لنظم استرجاع الإنترنت» تختلف 
عن تلك الخاصة بالأنواع الأخرى لنظم استرجاع المعلومات» من حيث اتباع الأولى 
للنهج الآلي القائم على الكلمات المفتاحية» ولا تكشف مصادر CS PY‏ 
وفقا للحقول. 
مقومات البحث: 

بوصفها أحد أنواع نظم استرجاع المعلومات» تكفل نظم استرجاع الإنترنبت » 
جميع مقومات البحث المتوافرة في بيئات الاسترجاع الأخرى تقريبا. إلا أن هناك 
بعض الجوانب الفريدة بالنسبة لنظم استرجاع الإنترنت نناقشها في هذا السياق. 

فالبحث البوليني» المسلم به في غير نظم استرجاع الإنترنت» لم يكن يحظى فيا 
مضى بالدعم في كل نظام من نظم استرجاع الإنترنت. ومن ناحية أخرى كانت علامة 
زائد )+( تستعمل على نطاق واسع بديلا عن المعامل AND,‏ في السنوات المبكرة 
لنظم استرجاع الإنترنتء إلا أن هذا أمر مضلل» نظرا OV‏ علامة زائد تمثل الرمز 
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بالنسبة لمعامل أو OR‏ أو الحاصل sum‏ المنطقي» كا بينا في القسم ۷/ ۲. وعلى الرغم 
من توقف هذا الشكل من المارسات. لتصبح علامة زائد رمرًا للوزن بالنسبة للبحث 
الموزونء فإن استعمال علامة زائد بوصفها معامل AND y‏ يسبب الخلط أو التشويش 
بالنسبة للمستفيد النهائي» وخصوصا ذلك الذي لم يارس البحث البوليني من قبل. 

والبحث بالتقارب ضروري في استرجاع العبارات (إذا لم تكن معلومات 
مرصد البيانات مكشفة بالعبارات) فضلا عن تحديد المواقع النسبية لمصطلحات 
الاستفسار. وتتسم نظم الخط المباشر بالقوة» على وجه الخصوص» في دعم عمليات 
البحث بالتقارب. وفي مقابل ذلك لم يضبح البحث بالتقارب من الخنصائص العامة 
لنظم استرجاع الإنترنت. ومن بين تلك النظم التي تدعم البحث بالتقارب على 
الإنترنت» يكفل القليل منها المدى الكامل لمعاملات التقارب» التي عادة ما تتوافر في 
نظم الخط المباشر والفهارس المتاحة على الخط المباشر. 

وفيا يتعلق بالبترء والبحث بالحقل» والبحث بمراعاة شكل الحرف الأول؛ 
فإن نظم استرجاع الإنترنت تدعم هذه التقنيات على نطاق محدود. وبقدرات محدودة. 
وإذا أخذنا البتر كمثال» فإن نظم الاسترجاع الأخرى يمكنها أن تكون محددة جداء 
بتحديد عدد الأحرف التي يتم بترهاء على سبيل SLM‏ أما معظم نظم استرجاع 
الإنترنت فيمكنها تحقيق البتر الأيمن غير المحدود فقط. ولا يزال البتر JI‏ هو الخيار 
الافتراضي default‏ في بعض الحالات» الأمر الذي يسفر عن المزيد من التشويش في 
نتائج الببحث. وکا ذكرنا في القسم ۸/ 5/ ۲/ ۲ فإنه ليس هناك سوى قليل من أشباه 
الحقول pte)‏ العنوان والمحدد الموحد لكان المصدر (URL‏ في نظم استرجاع 
الإنترنت» OY‏ مثل هذه النظم بلا حقول بالفعل. وليست هناك فرص كثيرة 
للمستفيد» OV‏ يحدد البحث بالحقل في نظم استرجاع الإنترنت. 
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ويظهر البحث الموزون» الذي قلا نجده في الأنواع الأخرى من نظم استرجاع 
المعلومات» ضمن رصيد مقومات البحث الخاصة بكثير من نظم استرجاع الإنترنت. 
وتستعمل علامة زائد (+) على نحو مطرد في نظم استرجاع الإنترنت بوصفها رمز 
الوزن الذي يضفي المزيد من الوزن على المصطلح المقصود. ويبدو أن البحث الموزون 
يتجاوز أو يتجاهل البحث البوليني على الإنترنت؛ ففي استفسار حول ”الضرائب 
والغرامة أو العقوبة“ tax AND penalty‏ على سبيل المثال» فإنه عند تحديد الوزن 
ل penalty‏ يمكن للنتائج أن تشتمل على مصطلح ley «zs penalty‏ يتم pele‏ 
tax‏ كلية في عملية البحث. 

والبحث المشوش لعا على الرغم من أنه ليس بالخاصية المشتركة للأنواع 
الأخرى من نظم استرجاع المعلومات» ينفذ أو يطبق في بعض نظم استرجاع الإنترنت؛ 
فإذا كان المرء يقصد على سبيل المثال» البحث عن شارع روزفلت Roosevelt Avenue‏ 
في خرائط el gal‏ فإنه يمكن لنظام استرجاع الإنترنت المتخصص في معلومات الخرائط 
إذا ما حدث خطأ في هجاء عبارة شارع روزفلت Roosevelt Avenue‏ أن يظل قادرا 
على إرشاد من يقوم بالبحث إلى المكان الصحيح» إذا ما توافرت الأجزاء الأخرى من 
العنوان (كالرمز البريدي مثلا) بشكل صحيح. وخاصية جوجل ”هل قصدت: Did‏ 
mean:....‏ ا0ل“ التي تظهر بعد وقوع all‏ المطبعي» عند إدخال استفسار البحث» 
من تطبيقات البحث المشوش أيضا. 

والبحث في مراصد بيانات متعددة ليس بجديد بالنسبة لنظم الخط المباشر. 
فعادة ما توضع مراصد البيانات الملائمة لتنفيذ مثل هذه الأنواع من عمليات البحث» 
أو تدار في نظام مضيف واحد؛ فنظام ديالوج DIALOG‏ على سبيل المثال» قادر على 
دعم البحث في مراصد بيانات متعددة» وذلك بضم عدة مئات من مراضد البيانات 
dy Leal‏ من حيث البنيان. By‏ حالة نظم استرجاع الإنترنت» يمكن لمصطلح البحث 
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في مراصد البيانات المتقاطعة Cross-database searching‏ أن +S‏ 0 مصطلحا 
أكثر ملاءمة في هذا السياق؛ نظرا OY‏ كل نظام قائم بذاته» مصمم على نحو مستقل» 
ومن ثم فإنها تختلف عن النظم الأخرى؛ فهذه النظم ليست مصممة كأقسام فرعية 
لكيان أكبر. وتسمى النظم التي يمكنها كفالة البحث في مراصد البيانات المتقاطعة؛ ما 
وراء £ ols‏ البحث metasearch engines‏ (مثل دو جبايل «(Dogpile‏ أو ما وراء 
نظم الاسترجاع «metaretrival systems‏ لكي يكون الأمر متسقا مع المصطلحات 
المستعملة في هذا الكتاب. ويختلف عدد نظم الاسترجاع القائمة بذاتباء التي يمكن U‏ 
وراء محرك البحث تغطيتهاء من محرك إلى آخر»ء وعادة ما يكون العدد في حدود تتراوح 
بين ستة نظم واثني عشر نظاما. وعادة ما يعمل البحث بالكلمات المفتاحية.المفردة على 
أحسن وجه» في مراصد البيانات المتقاطعة» نظرا OV‏ هناك أوجه اختلاف أكثر من 
مظاهر التشابه في نَم syntax‏ مصطلحات البحث ومعانيهاء فيا بين نظم الاسترجاع 
القائمة بذاتها تلك. ويستبعد بعض ما وراء نظم الاسترجاع في الإنترنت المكررات 
قبل تقديم النتائج للمستفيد. 


والبحث القائم على المفهوم أو المعنى» لا على مضاهاة الكلمات المفتاحية» هو 
المفضل على وجه الخصوص على الإنترنت» نظرا لأنه حاسم في الارتفاع بمستوى أداء 
الاسترجاع. كا أن اللغات المقيدة لا تستعمل عادة في نظم استرجاع الإنترنت. وقد 
جرت عدة حاولات في هذا الصدد؛ فمن الممكن على سبيل SLA‏ لنظام استرجاع 
المعلومات أن يولد آليا قائمة بالمفاهيم» بناء على مصطلحات الاستفسارات التي يتم 
إدخاهاء ويمكن للمستفيد أن ختار منها؛ فإذا كان الاستفسار على سبيل المثال» 
”احجز رحلة“ cbook a flight‏ فإن النظام يقدم قائمة خيارات منسدلة» تشتمل على 
مفاهيم ais”‏ جرا cair travel‏ و ”,+“ مهو مسار أو خط سير“ 
trajectory‏ وحينئذ يختار المستفيد مفهوما مقابلا (مثل ”السفر جوا (air travel‏ 
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لكي يواصل عملية البحث الفعلي. وهناك مثال آخر يتصل ببحث المفاهيم» يكفل 
للمستفيد القدرة على إجراء عمليات البحث دلاليا. وفي هذا التطبيق» لا يمكن لغياب 
كلمة ما من الوثيقة ( ”مترو الأنفاق“ (ds subway‏ أن تستبعد احتال أن تكون 
الوثيقة صالحة موضوعيا أو مفاهيميا للاستفسار حول ”النقل العام“ public‏ 
على سبيل JE‏ ويمكن القول على وجه التحديد. أن مثل هذه 
التطبيقات لا يمكن النظر إليها إلا بوصفها مجرد أشباه بحث مفاهيمي» نظرا OY‏ 
تكشيفها لا يبدو قائ) على المفاهيم» وهذا من الشروط المسبقة للبحث المفاهيمي. 
وبالأحرى فإنه يتم رسم خريطة للمفاهيم USL,‏ المفتاحية في أثناء غمليات 
الببحث» باستعمال أدوات معينة (قائمة بالمترادفات على سبيل المثال). وفي الأنواع 
الأخرى من نظم استرجاع المعلومات» يكاد استعمال اللغات المقيدة يكون هو 
القاعدة» حيث يحظى البحث بالمفاهيم بالدعم بوجه عام. وفضلا عن ذلك فإنه عادة 
ما يصبح التعامل مع نظم استرجاع الإنترنت» التي تدعم البحثء مقابل رسوم» 
بمجرد أن تكمل اختبارها النهائي على الإنترنت. ويمكن أن تكون العنكبوتية 
الدلالية» التي نتناو ها في القسم ٠۳/٠١‏ قادرة على أن تكفل البحث المفاهيمي بلا قيد 
ولا شرط» عندما يتم إنشاؤها. 

وبحث الأنداد «peer-to-peer (P2P)‏ إحدى الخواص الجديدة في حقل 
استرجاع المعلومات» ويرتبط ارتباطا وثيقا بنهج التنقية التضامنية أو التعاونية 
«collaborative filtering‏ المتبع في التسويق التجاري. إذ يتم فحص الخلفيات 
التاريخية» والإشارات المرجعية الخاصة بالمستفيدين السابقين» عند تلقي استفسار 
جديد» من أجل اكتشاف المعلومات المرتبطة بالموضوع. وعندما ينضم المرء إلى شبكة 
الأنداد P2P‏ فإنه يتم بحث استفساره مقابل المواقع التبي زارها وأشار إليها من 
ينتمون إلى الشبكة المبدئية نفسها. ومن الممكن تكرار هذه العملية بتوسعة مجال 
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البحث» ليشمل شبكات الأنداد الإضافية التي ينتمي إليها هؤلاء. وقد تناول فستا 
Festa (2001)‏ اعتادا على باندانجو Pandango‏ وهو مشروع قامت بتنفيذه آي 
فايف الرقمية (i5 digital‏ كمثال: 
يمكن ... لباندانجو أن يقر الارتباط بالموضوع بفحص 
شبكة مشعة radiating‏ من “من يسجلون الإشارات المرجعية 
5 . وبمجرد أن يقوم شخص ما بتحميل باندانجو 
50 ونضم إلى شبكة أنداد cle‏ فإنه يمكن لبحث ذلك 
الشخص بالكلات المفتاحية» أن يفحص الخلفيات التاريخية 
للعنكبوتية» والإشارات المرجعية لشبكة مبدئية لمئة ممن يسجلون 
الإشارات. وحينئذ يمكن للتطبيق أن يبحث الخلفيات التاريخية 
لأولئك المئة على العنكبوتية» وجمع عشرة آلاف ممن يسجلون 
الإشارات» ويعيد ذلك مرة أخرى» بحيث يمكن للاستفسار 
المرور على صفحات العنكبوتية التي تمت زيارتها والإشارة إليها 
من جانب مليون شخص. (P.1)‏ 1 
وبحث الأنداد لا مركزي» ويفيد من معلومات البحث الناشئة عن مستفيدين 
سابقين» بدلا من البحث في مرصد بيانات مركزي. ويمكن لقضايا معينة 
dane pra ls)‏ والأمن على سبيل المغال) أن تغار حتما نتيجة لبحث الأنداد على 
الإنترنت. إلا أن هذه القضايا لا تدخل في Jle‏ اهتمام هذا الكتاب. MLS‏ يسمى 
بحث الأنداد بالرابط bonding‏ في بعض الوثائق (مثل 2000 (Schwartz,‏ ومن 
ناحية أخرى يمكن لحركة الجيل الثاني للعنكبوتية 2.0 Web‏ أن تحل محل بحث 
الأنداد بخواص إضافية. ونستكشف تأثير تقنيات الجيل الثاني للعنكبوتية 2.0 Web‏ 
على نظم استرجاع المعلومات في القسم رقم ۸/ ۵. 
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تقنيات الترتيب الطبقي: 
: دخلت طرق الترتيب ranking Ahi‏ في استرجاع معلومات الإنترنت» 
كجهد يهدف لمساعدة المستفيد في العنور على الإبر في كومة التبن» على نحو أكثر 
فاعلية. وتشمل الخوارزميات التي عادة ما تطبق للترتيب الطبقيء لنتائج عمليات 
البحث في جميع بيئات استرجاع المعلومات» كما تناولناها في القسم 5/ eY [V/V‏ تردد 
الصطلحات» وتجاور المصطلحاتء ومواقع المصطلحات. والتردد العكسي للوثائق. 
ley‏ ترتب هذه الخوارزميات نتائج عمليات البحث وفقا للخصائص الجوهريية 
للوثائق (تردد المصطلحات على سبيل المثال)» هناك طرق ترتيب طبقي جديدة» تركز 
على الخصائص الجوهرية الناشئة عن البشر عندما يصلوا إلى وثائق العنكبوتية 
المستهدفة» أو عندما ينشئون مواقعهم الخاصة. 
وتستند أول تقنية جديدة للترتيب الطبقي» التي كان لمؤسسي جوجل» سيرجي 
برين Sergey Brin‏ ولورنس بيج Lawrence Page‏ فضل الر يادةفيهاء على 
الروابط الراجعة backlinks‏ أي الروابط التي تشير إلى الموقع المزمع استرجاعه 
.(Brin & Page, 1998)‏ وتفترض هذه التقنية المسماة بترتيب بيج الطبقي 
PageRank‏ أنه كلما زاد ote‏ مرات الإشارة إلى الموقع من جانب مواقع أخرى» 
أصبح أكثر أهمية. وتبدو هذه التقنية مشابهة إلى حد بعيد لتحليل الاستشهادات 
المرجعية» إحدى الطرق الراسخة التي تستخدم ضمن أشياء أخرى. لتقييم جودة 
الوثائق التخصصية. وباستعارة بعض المصطلحات من تحليل الاستشهادات المرجعية» 
يمكننا تسمية الموقع الذي يشار إليه بالموقع المستشهد به بينما يصبح الموقع الذي يشير 
إلى الموقع المستشهد به الموقع المصدري» الذي يرد به الاستشهاد citing site‏ وبعبارة 
أخرى» طور جوجل طريقة لتحليل الروابط التي تشير إلى المواقع المستشهد بهاء 
وترتيب هذه المواقع طبقيا. واسم ترتيب بيج الطبقي PageRank‏ خوارزمية تلاعب 
بالكلمات؛ لأنه سمي باسم أحد واضعيه» وهو لورنس بيج» ويدل على المستهدف 
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بالترتيب الطبقي وهو صفحات العنكبوتية. وتوضع المحددات الأخرى كالعنوان» 
وأشكال الأحرف» وتقارب ال صطلحات» وأهمية المواقع المصدرية التي ترد بها 
الاستشهادات. في الحسبان أيضاء في حساب الرتبة )1998 .(Brin & Page,‏ 

وقد تطورت خوارزمية الترتيب الطبقي الحديدة الثانية» التي تعرف بنهج 
الرواج أو الشيوع «popularity approach‏ في دايركت هيت“ Direct Hit‏ التي 
أصبحت في| بعد جزءا من Teoma “9L 3s‏ ثم دخل تيؤما lab‏ بعد في حوزة آسك 
دوت وم٠ Ask.com‏ وهو نظام آخر لاسترجاع الإنترنت. وترتب هذه 
ا لخوارزمية المواقع طبقيا بناء على عدد مرات زيارتها فعلا من جانب المستفيدين (ومن 
هنا جاءت كلمة التسديدة hit‏ في Direct Hit‏ فإذا نظرنا إلى آلتافيستا AltaVista‏ 
وما يناظره من حركات البحث» بوصفها نظ| لاستر جاع المعلومات» يتحكم فيها 
المؤلفون (أي أن صلاحية نتائج عمليات البحث أو اتصاها بالموضوع» تتقرر بناء على 
مدى مضاهاة الكلات المفتاحية لمحتوى الوثيقة)» وإذا ما أسمينا ياهو! وما يناظره من 
أدلة نظا لاسترجاع المعلومات يتحكم فيها المحررون (أي أن المحررين يعثرون على 
المواقع ويفهرسونها بفحصها كلا على Gre‏ إذن فالتسديدة المباشرة Direct Hit‏ 
تمثل نوعا ثالثا من طرق البحث» وهو نظم استرجاع المعلومات التي يتحكم فيها 
المستفيد» ويتوقف فيها الترتيب الطبقي لنتائج عمليات البحث على الخيارات التي 
يقرها المستفيدون أنفسهم )1998 (Sy (Frauenfelder,‏ زاد عدد زيارات الموقع 
من جانب آخرين» يزداد الموقع رواجاء ويتحسن وضعه الطبقي. إلا أن هذه 
الخوارزمية على وجه الخصوصء لم تطبق على نطاق واسع. 


() كانت إحدى شر كات محركات البحثء ومقرها بوسطون. (المترجم) 

(**) تيؤما محرك بحث في الإنترنت» تطور عام Vers‏ (المترجم) 

(**) آسك دوت كوم محرك بحث في العنكبوتيةء تطور عام ١1۹۹ء‏ ويركز على الإجابة عن 
الأسئلة. (المترجم) 
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وتنطوي خوارزمية الترتيب الطبقي الثالثة على خطوتين؛ أولاهما ترتيب المواقع 
طبقياء باتباع طرق الترتيب الطبقي التقليدية wll toa pS‏ وتقارب 
المصطلحات. من أجل تحليل الروابط الفائقة» المتضمنة في الموقع والنص المحيط هذه 
الروابط. والخطوة الثانية هي إعادة تدقيق هذه الروابط الفائقة باتباع طريقة الروابط 
الراجعة التي يستخدمها جوجل. وقد تطورت طريقة الترتيب الطبقي المسماة هيتس 
HITS‏ (اختیار موضوع النص glial‏ الناجم hypertext induced topic‏ 
«(selection‏ على يدي جون كلاينبر )1999( Jon Kleinberge‏ عندما كان يعمل 
بمشروع آي بي إم IBM‏ كليفر CLEVER‏ وهدف كليفر للتحقق من النوعين 
التاليين من مواقع العنكبوتية» وهما: )١(‏ الحجج authorities‏ أي أفضل مصادر 
المعلومات حول موضوع معين» و(۲) الحواشي hubs‏ أي مجموعات روابط تلك 
المواقع. ويؤدي تكرار هاتين الخطوتين إلى العثور على نتائج البحث وتنقيتهاء تلك 
النتائج التي تقدم في النهاية بوصفها صفحات الروابط الصا حة أو المتصلة بالموضوع» 
مقسمة إلى حواش وحجج. ويمكن للحواشي والحجج أن تحتل مراتب أعلى من 
المواقع العادية. وكليفر رسمياء أحد مشروعات بحوث آي بي إم. ولم يقدم حتى 
OYI‏ سوى عمليات بحث وتقارير بحوث للعرضء أما خوارزمية هيتس HITS‏ 
فترتبط ارتباطا تكامليا على نحو متزايد» بكثير من طرق الترتيب الطبقي في نظم 
استرجاع الإنترنت. 

وطريقة الروابط الراجعة» التي استخدمت أولا من جانب جوجلء ثم eB‏ بعد 
من جانب كثير من نظم استرجاع الإنترنت الأخرى» ليست جديدة في بيئة 
الاسترجاع على الخط المباشر؛ فقد صمم معهد المعلومات Institute for “i ale]‏ 


Č)‏ أصبح الآن 3 حوزة شركة Reuters - Thopson‏ واتسع نشاطه في مراصد بيانات 


الاستشهادات المرجعية؛ متمثلا في عنكبوتية Web of Knowledge 4 all‏ وعنكبوتية العلوم 
pil) . Web of Science‏ جم) 
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Scientific Information (ISI)‏ سلسلة من مراصد البيانات (مثل كشاف 
الاستشهاد المرجعي في العلوم iv (Science Citation Index‏ ستينيات القرن 
العشرين» وفقا لمبدأ الاستشهاد Ogee Ul‏ إلا أن تكرار الاستشهاد المرجعي لم يكن 
يستخدم كمعيار للترتيب الطبقي gil‏ عمليات البحث في مراصد بيانات 
الاستشهاد المرجعي» حتى تم إدخال الأمر ”رتب RANK “Lab‏ من جانب ديالوج 
DIALOG‏ ني عام ۱۹۹۳ . أما طريقة التسديدات المباشرة Direct Hits‏ للرواج» 
وخوارزمية تسديدات كلاينبرج Kleinberg's HITS‏ من oes elit‏ 
هناك ما يقابلهم| في بيئات الاسترجاع الأخرى؛ حيث لا تزال طرق الترتيب الطبقي 
غير متوافرة على نطاق واسع. 

Lees‏ يمكن لطرق الترتيب الطبقي التقليدية أن تسفر عن مشكلات» كحشو 
5 الكليات (أي تكرار بعض الكليات المفتاحية عمداً للحصول على مرتبة 
أفضل)» أو لا تؤدي أي معنى يذكرء في مواقف مثل الدفع في مقابل المكانة pay for‏ 
sl) placement‏ ترتيب نتائج عمليات البحث طبقيا ely‏ على كم منايسدد من 
رسوم) فإن التقنيات الثلاث التي تناولناها هناء تفتح بعدا جديدا للترتيب الطبقي 
لمواقع العنكبوتية وتقييمها. إلا أنها يمكن أن تسفر عن المزيد من مظاهر التحيز 
في عملية الترتيب الطبقي؛ لأنه يمكن للمواقع الجديدة غير المرتبطة أن تواجه 
وقتا متزايد الصعوبة حتى تصبح بارزة في نظم الاسترجاع تلك & (Lawrence‏ 
.Giles, 1999)‏ 


() لمزيد من المعلومات حول كشافات الاستشهاد الرجعي» راجع: حشمت قاسم. كشافات 
الاستشهاد المرجعي وإمكاناتها الاسترجاعية. المجلة العربية للمعلومات» مج 7.٠ع؟؛‏ يونيو 
.٠‏ وأعيد النشر في: حشمت قاسم. دراسات في علم المعلومات. ob ALAN Yb‏ دار 
غريب» 66 ص ص م0 (المترجم) 
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وليست خوارزميات الترتيب الطبقي القائمة على الروابط» بمنأى عن إساءة 
الاستخدام والانتقادات. وتشمل التدابير الرامية إلى استغلال نبج الروابط الراجعة 
مزارع الروابط link farms‏ وصفحات المداخل doorway pages‏ ومزارع 
الروابط مجموعات من الروابط التي تشير إلى أي صفحة أخرى في موقع معين» من 
أجل تعزيز إحصاء الروابط الراجعة لذلك الموقع» بينما صفحات المداخل عبارة عن 
صفحات عنكبوتية تتكون كاملة من روابط لتحقيق الهدف نفسه. ويمكن أن تستخدم 
طريقة التسديدات HITS‏ للتصدي جزئيا للمشكلات الناشئة عن مزارع الروابط 
وصفحات المداخل. 

وبسبب تلك الإجراءات التعسفية أيضاء يتم استعمال أكثر من مئتي إشارة (أي 
عوامل) في الترتيب الطبقي لنتائج عمليات البحث الخاصة باستفسار معين» من 
جانب جوجل Google (2008b)‏ وقد لا تستعمل نظم استرجاع الإنترنت 
الأخرنى» ذلك العدد الكبير من المعايير كا يفعل جوجل» في الترتيب الطبقي لنتائج 
البحث. إلا أنه بعد التحقق من هذه الأنواع من الإجراءات التعسفية» لم يعد بإمكان 
أي نظام لاسترجاع معلومات الإنترنت» الاعتماد على أي طريقة بعينها قائمة على 
الروابط لأغراض الترتيب الطبقي. 

وانتقادات الترتيب الطبقي القائم على الروابط» متعددة الجوانب بوجه عام؛ إذ 
يتم أولا احتساب كل رابطة بوصفها صوتا واحدا للصفحة المرتبطة» دون التمييز بين 
الروابط. ثانياء لا تبذل أي جهود للتحقق من مكان صفحة العنكبوتية التي تشير إليها 
الرابطة؛ فالرابطة بعنوان ال ع عد UL‏ تعامل على النحو نفسه؛ الذي 
تعامل به الرابطة بعنوان البريد الإلكتروني الخاص بمسئول العنكبوتية webmaster‏ 
الذي يمكن أن يكون مسئولا عن تطبيق لغة ترميز النصوص الفائقة بالنسبة للصفحة 
فقطء وليس عن Ll gt‏ الفكري على الإطلاق. ثالثاء يتم احتساب الروابط الذاتية 
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cself-links‏ والروابط المكررة» والروابط من مراصد البيانات المترابطة فيا بينهاء 
والمواقع التي تكرر مواقع قائمة ed mirror sites‏ يتم احتساب كل هذه جميعا 
بوصفها مساوية للروابط العادية (2005 (Lewandowski,‏ وتردد مثل هذه 
الانتقادات» وإلى حد بعيد» صدى تلك الانتقادات التي توجه للمؤشرات القائمة على 
الاستشهاد ا مرجعي» في القياسات الوراقية» وقياسات النشاط العلمي 
.scientometrics‏ فدوافع ٤ lels «Soy It‏ ذلك ols‏ اساب اللاستشهاد المرجعي'*» 
متعددة» ومعقدة» ومن الضعب التحقق منها نظرا لطبيعة أسلوب 

الربط )2005 (Chu,‏ وفضلا عن ذلك Gu‏ ارات وهنسنجر Bharat and‏ 
Hensinger (1998)‏ أن الحواشي والحجج المرتبطة ارتباطا وثيقاء التي يتم اكتشافها 

يقة التسديدات HITS‏ قد لا تكون حول الموضوع hol‏ 

تعديل البحث: 

يحظى تعديل استفسارات أو صيغ الببحث» في نظم الاسنترجاع على الخط 
المباشر بالدعم المناسب؛ فبإمكان المستفيد توسعة أو تضييق عملية البحث بمختلف 
الطرق المتاحة في النظام (كالبتر أو البحث بالحقل على سبيل المثال). وبالمقارنة بنظم 
الخط المباشر» تبدو الفهارس المتاحة على الخط المباشر» أقل مرونة في تعديل صيغ 
الببحث» على الرغم من تحسن الوضع في أجيالها التالية. يضاف إلى ذلك أن الحاجة إلى 
تعديل عمليات البحث في الفهارس المتاحة على الخط المباشر محدودة نسبيا؛ نظرا لأن 


(*)لمزيد من المعلومات حول علاقة الوثائق التى ترد بها الاستشهادات source documents‏ 
والوئائق المستشهد «cited documents Ly;‏ راجع : 
حشمت قاسم. تحليل الاستشهادات المرجعية وتطور القياسات الوراقية. المجلة العربية 
للمعلومات» مج”.ع5؛ ديسمير NIA‏ ص ص .417-١١‏ وأعيد نشر هذه المقالة في: حشمت 
قاسم. دراسات في علم المعلومات. Yb‏ القاهرة» دار غريب» 6065 » ص ص ۱٤۷-۱۱۷‏ . 
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البحث عن أوعية معروفة يشكل نسبة لا يستهان بها من إجمالي عمليات البحث في 
الفهارس المتاحة على الخط المباشر. 

وفي مقابل ذلك» op‏ عمليات البحث في الإنترنت عادة ما تتطلب تعديلاء 
نظرا للكميات الضخمة من النتائج التي تسفر عنها عمليات البحث» وما يكتنف 
السماح للمستفيد النهائي بصياغة استفسار محكم من صعوبات؛ لأنه أولا لا يبدو من 
السهل بالنسبة للمستفيدين تعديل عمليات بحثهم؛ فليست هناك أولا OLS‏ يتم 
إنشاؤها واختزانها لكل عملية بحث» بين| يعد ذلك من ا لخصائص المألوفة في نظم 
الخط المباشر. ثانياء لا تتوافر سوى طرق للتعديل المحدود» بالنسبة لإحكام عمليات 
البحث؛ فجوجلء على سبيل المثال» يكفل للمستفيدين إجراء المزيد من عمليات 
البحث. في حدود النتائج التي يتم استرجاعهاء بمجرد أن يتم الاسترجاع» وذلك عن 
طريق اللجوء إلى خيار ”البحث في حدود النتائج “. وذلك في الأساس هو ما يمكن 
للمستفيد الحصول عليه في نظم استرجاع الإنترنت الراهنة» فيا يتعلق بتعديل 
البحث. ولا تزال مرونة وتنوع خيارات تعديل عمليات البحث» التي تحظى بالدعم 
في بيئات الاستر جاع الأخرى» مفتقدة على الإنترنت. 

Uy‏ كانت اللغات المقيدة لا تطبق بوجه عام في تجهيز معلومات الشبكات» فإن 
بعض النظم (مثل جيجا بلاست «(Gigablast‏ تحاول بناء على الاستفسار الذي 
يدخله المستفيد» اقتراح قائمة بالمصطلحات من أجل تعديل عمليات البحث. فعندما 
يتم على سبيل المثال» إدخال استفسار عن الزنبق أو الخزامى tulips‏ يقدم جيجا 
بلاست المصطلحات التالية للمزيد من إحكام عملية البحث: Holland, plant,‏ 
spring, tulip bulbs‏ وأكثر من ذلك. وبإمكان المستفيد اختيار Gi‏ من 
المصطلحات الواردة في القائمة» لاستعماله في تعديل البحث. إلا أنه على الرغم من 


(*) محرك بحث في الإنترنت. منفتح المصدر. (المترجم) 
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توافر مثل هذه الخواص التي تطبق في بعض النظم» لا يزال من الصعب بمكان على 
المستفيدين من الإنترنت» تضييق عمليات البحث إلى المستوى المرغوب فيه. إلا أنه 
هناك كل من التلقيم المرتد الخاص بالصلاحية crelevance feedback‏ والطريقة 
الآلية لتوسعة عمليات البحث» في نظم مثل جوجل. وبإمكان المستفيد استدعاء 
التلقيم المرتد الخاص بالصلاحية» وذلك ببساطة بالنقر على الروابط الفائقة المسماة ب 
”الصفحات “ALA‏ أو ”المزيد مثل هذا“ على سبيل SLE‏ وهناك في الوقت نفسه 
Sle‏ للمخاوف بشأن مدى جدوى هذه الطريقة:؛ إذا ما كان المستفيد در فعلا 
بالغرق في عدد نتائج عملية البحث التي استرجعها النظام. 


واجهة التعامل: 

عادة ما تكون لغة الأوامر والاختيار من قوائم الخيارات: هما طريقتا واجهة 
التعامل السائدتان في نسبة كبيرة من نظم الخط SUM‏ والفهارس المتاحة على الخط 
المباشر. ويفسر ذلك على الأقل لما كان لبعض نظم استرجاع المعلومات» بالنسبة لغير 
تطبيقات العنكبوتية (مثل آرشی Archie‏ وفيرونيكا (Veronica‏ واجهات تعامل من 
أنواع مائلة. وعندما تنصبح العتكبوتية تطبيقا رئيسا للإنترنت» ومنصة مألوفة 
للتطبيقات الأخرى (كالبريد الإلكتروني مثلا) تميل جميع نظم استرجاع الإنترنت» OV‏ 
تكون لها واجهات تعامل مع العنكبوتية» وهي واجهات تصويرية فائقة البناء أو 
التنظيم. ويسهم هذا التوحيد في واجهات التعامل في تعاطف نظم استرجاع الإنترنت 
ككل مع المستفيدء وهي خاصية ليست جوهرية بالنسبة للأنواع الأخرى من نظم 
استرجاع المعلومات. 

وقصارى القول» فإن لنظم استر جاع الإنترنت» خواصها الفريدة في التغطية» 
والمعلومات المصدرية» والتكشيف» وإمكانيات البحث» وطرق الترتيب الطبقي» 
وتعديل الببحث» وواجهات التعامل» وذلك عندما تقارن بنظم الخط ALA‏ 
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والفهارس المتاحة على الخط المباشر. ويمكن للبحث عن المعلومات متعددة اللغات» 
متعددة الوسائط أن يميز أيضا نظم استرجاع الإنترنت عن الأنواع الأخرى من نظم 
استرجاع المعلومات. ونغطي ذلك الموضوع في الفصل التاسع ”استرجاع المعلومات 
الفريدة في المحتوى أو في الشكل" . 
أجيال نظم استرجاع الإنترنت: 

لقد تطورت نظم استرجاع الإنترنت» لتصبح عضوا جديدا في أسرة استرجاع 
المعلومات» ولتصبح لا غنى عنها بالنسبة لكثير من المستفيدين ;2008 (Fallows,‏ 
Fallows, Rainie & Mudd, 2004)‏ وقد أدخلت الكثير من التعديلاات 
والتحسينات على هذه النظم منذ بدايتها. وعلى الرغم من حداثة عهدها في التطور 
مقارنة بها يقابلهاء يمكن تقسيم نظم استرجاع الإنترنت إلى ثلاثة أجيال مختلفة: بناء 
على الخواص الواردة في الجدول رقم V/A‏ 

ويدل الجيل الأول لنظم استرجاع الإنترنت» على مثل هذه النظم الرائدة مثل 

ياهو! وزواحف العنكبوتية .Web Crawler‏ فقد كانت المعلومات النصية هي النوع 
الرئيس للمعلومات التي كانت تجمعها تلك النظم. ولم يكن تجهيز المعلومات متعددة 
الوسائط يحظى باهتمام يذكرء عندما تم بناء هذا اليل من نظم استرجاع الإنترنت» إلى 
جانب عرض الصور الكامنة فعلا في الصفحات أو المواقع» جنبا إلى جنب مع 
المعلومات النصية التي يتم استرجاعها. وكانت الأدلة ومحركات البحث متميزة عن 
بعضها البعض» وكان كل نظام يكفل طريقة واحدة للاسترجاع» سواء كانت التصفح 
أو البحث. وكانت هذه النظم تكشف بالكلمات المفتاحية» وتدعم كجيل أول» 
إمكانيات البحث الأساس (كالبحث البوليني» والبتر» والبحث بالتقارب على سبيل 
المثال). ولم يكن تعديل البحث ممكنا في هذا الجيل من النظم. ولم تكن خرجات 
عمليات البحث ترتب طبقياء إلا أنه كانت تتاح للمستفيدين فرصة اختيار شكل 
العرض (كالعنوان فقطء أو العنوان مع ملخص موجز على سبيل (JEU‏ وكان بإمكان 
plas‏ عرض عدد النتائج ١ ٠(‏ أو ٠١‏ أو de ۳١‏ سبيل المثال) دون تجديد الشاشة. 
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الجدول رقم ۸/ ۲ أجيال نظم استرجاع الإنترنت 





وكان الجيل الثاني لنظم استرجاع الإنترنت أكبر على نحو ملحوظ من الجيل 
الأول. وكانت بعض النظم تمثل تحسينات على طبعاتها المبدئية (مثل ياهو!) بينما كانت 
نظم أخرى تمثل إضافات جديدة (مثل جوجل). ولم يكن عدد لا يستهان به من نظم 
الجيل الثاني يكفل خدمات استرجاع معلومات نصية فحسب. وإنن) كانت تساعد 
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أيضا في العثور على ملفات الصور ومقاطع الفيديو والتسجيلات السمعية والموسيقية 
إم بي ثري 3/183. إلا أن عملية الاسترجاع كانت محدودة» وتقتصر على مراصد 
البيانات أو الملفات التي تشتمل على نوع بعينه من معلومات الوسائط المتعددة. 
ويعبارة أخرى فإن المعلومات النصية ومعلومات الوسائط المتعددة كانت تجهز بمعزل 
عن بعضها البعض» في هذا الجيل من نظم استرجاع الإنترنت. وعلى الرغم من إدارتها 
بواسطة شركات مختلفة في بعض الحالات» كان نهجا التصفح والبحث يتوافران في 
الموقع ذاته» بحيث يمكن للمستفيد أن يختار من بين بجي الاسترجاع دون الانتقال 
إلى موقع آخر. وكان التكشيف لا يزال يعتمد على الكلمات المفتاحية» إلا أن بعض 
الجهود كانت تبذل لرسم خرائط المفاهيم في شكل [US‏ مفتاحية» باستخدام وسائل 
للبحث عن المفاهيم (راجع القسم ۸/ .)١ /۲ /٤‏ وبينما ظل البحث الأساس يحظى 
بالدعم من جانب الجيل الثاني لنظم استرجاع الإنترنت» فقد تم إدخ ال إمكانيات' 
بحث متقدمة (كالبحث الموزون على سبيل المثال). وتكفل معظم نظم استرجاع 
الإنترنت نوعين من إمكانيات البحث؛ )١(‏ البحث البسيط» الذي يتضمن عمليات 
بحث خالية من الرموز أو الإشارات (كالمعاملات على سبيل المشال)»ء )1( البحث 
المتقندم الذي يقبل الرموز والإشارات. وتستخدم نماذج forms‏ البحث عادة 
لعمليات البحث المتقدم. وكان من الممكن توسعة عمليات البحث أو تضييقهاء بعدد 
محدود من الطرقء كالتحديد بالتاريخ» أو التحديد باللغة» أو البحث في حدود 
النتائج» أو بالتلقيم المرتد للصلاحية أو الاتصال بالموضوع. وكانت نتائج عمليات 
البحث ترتب طبقيا في معظم الأحيان» بناء على خوارزمية ترتيب طبقي» عادة ما كان 
يتم الاحتفاظ بمكوناتها طي Ole‏ وقد تراجعت خيارات عدد المخرجات» وشكل 
العرض تدريجيا في هذا الجيل من نظم استرجاع الإنترنت» نظرا لتراجع أهميتها بالنسبة 
للمستفيد. وكنظم لاسترجاع المعلومات حقق الجيل الثاني قدرا كبيرا من التطور في 
الوظيفية والأداء. 
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ويمكن أن يكون الجيل الثالث لنظم استرجاع الإنترنت» قد أحرز المزيد من 
الارتقاء بمستوى الخواص الواردة في الجدول رقم ۸/ EY‏ فلم تعد الوسائط المتعددة 
تعامل أولا بمعزل عن المعلومات النصية؛ في الجيل الجديد لنظم استرجاع الإنترنت» 
وإنما تكاملت تقنيات تجهيز الوسائط المتعددة واسترجاعهاء مع تلك الخاصة 
بالمعلومات النصية. ونظرا لتميز العنكبوتية بقدرتها على تقديم المعلومات متعددة 
الوسائط» ولأا قد أصبحت التطبيق الرئيس للإنترنت» فإنه لم يعد هناك مبرر لأن لا 
تكون هناك قدرة على تقديم الوسائط المتعددة» وتجهيزها واسترجاعهاء جنبا إلى جنب 
مع المعلومات النصية» مسايرة لتطور البحث في استر جاع معلومات الوسائط 
المتعددة. ثانياء تكاملت الأدلة ومحركات البحث» بدلا من توافرها ببساطة في الموقع 
نفسه» وبذلك يمكن للمستفيد أن يبحث في حدود فئة قابلة للتصفح (كما يتم 
بياهو!)؛ ثم تتجمع نتائج عمليات البحث في فئات للتصفح DIS)‏ كلاستي 
(Clusty‏ وفضلا عن تكشيف الكلمات المفتاحية» أصبح من الممكن لتكشيف 
المفاهيم أن يتم» بعد أن تحقق المزيد من التقدم في البحث حول معالجة اللغة الطبيعية 
والتعبير عنها. كذلك يمكن لمقومات البحث التي كانت تدعمها الأجيال السابقة» أن 
يرتفع مستواها وتتعزز» بالتركيز على الارتقاء بمستوى التحقيق. كما يتم أيضا إدخال 
مقومات بحث إضافية (كالبحث في اللغة الطبيعية على سبيل (JAN‏ في رصيد 
مقومات الاسترجاع التي يوفرها النظام. وكذلك يمكن توجيه طريقة تعديل البحث 
بشكل أوضح» نحو تضييق عمليات البحث على نحو فعال؛ نظرا OY‏ المستفيد عادة 
ما تغمره الأعداد الهائلة للنتائج التي تسفر عنها نظم استرجاع الإنترنت. ويمكن 
لتقديم نتائج عمليات البحث أن يرتب طبقيا على نحو مثالي» وأن يطوع Las‏ 
لمواصفات المستفيد بدلا من خيارات النظام المحددة سلفا. فجوجل» على سبيل 
المثال» في واجهة بحثه المتطورةء يكفل للمستفيد أن يقرر من بين أشياء أخرى» ما إذا 
كان من الممكن للنتائج المزعجة أن يتم التخلص منهاء أو ما إذا كان من الممكن 


315 


لصفحات في نطاق شبكة معينة أن تتاح. ويمكن لنظم استرجاع الإنترنت من الجيل 
الثالث» أن تكون قادرة على إبراز تطورات ملحوظة في أداء الاسترجاع. 

وكا يتبين من هذه التوصيفات» فإن نظم استرجاع الإنترنت (LS‏ يبدو قد 
تخطت جيلها الأول» وتتقدم بقوة في الجيل الشاني. وقد بدأ الجيل الثالث يلوح في 
الأفق» بإمكانيات قوية. ولقد لاحظنا منذ منتصف العقد الأخير من القرن العشرين» 
تغير أجيال نظم استرجاع الإنترنت» نظرا للتطور السريع للإنترنت» التي من أجلها 
صممت أدوات الاسترجاع تلك. ولا يمكن المبالغة في أهمية الإنترنت في مجال 
استرجاع المعلومات» وخصوصا في العصر الرقمي. 


نظم استرجاع الإنترنت واسترجاع المعلومات: 

لم تعد الإنترنت مستودعا عملاقا للمعلومات فحسب» وإنها أصبحت أيضا 
منصة مألوفة للوصول إلى أنواع أخرى من نظم استرجاع المعلومات. ونظم استرجاع 
الإنترنت أدوات لاغنى عنها ولاشك لاسترجاع المعلومات من الإنترنت. كذلك 
تعد هذه النظم بمثابة بوابات لمصادر المعلومات الأخرى. ونظرا لضخ المزيد والمزيد 
من المعلومات على الإنترنت» يمكن LAY‏ نظم استرجاع الإنترنت أن تزداد تناسبيا. 

وفضلا عن ذلك» فإن نظم استرجاع الإنترنت تتحول الآن إلى مختبر ونافذة 
عرض للأساليب الحديثة المتقدمة المتطورة لاسترجاع المعلومات» وهذا هو الدور 
الذي نمضت به نظم الخط المباشر في الماضي. ولكي يظل مواكبا لأحدث التطورات في 
Sle‏ استرجاع المعلومات» يتعين على المرء مراقبة نظم استرجاع الإنترنت» بدلا من 
نظم الخط المباشر أو الأنواع الأخرى من النظم» عن كثب. فالتغيرات تحدث 
باستمرار» إن لم تكن على أساس يومي في نظم استرجاع الإنترنت. والنشرات 
الإخبارية القائمة على الإنترنت» وقد نشأت المواقع (مثل Notess, 20089: Third‏ 
(Door Media, 2008‏ لإحاطة المستفيد [de‏ بأحدث التطورات حول هذه النظم. 
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ومن ناحية أخرى» OB‏ نظم استرجاع الإنترنت كفئة» سيئة السمعة» نظرا 
لانخفاض معدل التحقيق في أدائها في البحث. وقد لا يكون من الممكن الوص ول إلى 
المعلومات التي تسترجع من الإنترنت» نظرا لعوامل كالروابط المتقطعة والمتقادمة» 
وهذه نتيجة أقل احتالا بكثير في البيئات الأخرى لاسترجاع المعلومات؛ كذلك يتعين 
على المستفيد أن يكون مسئولا أيضا عن الحكم على جودة المعلومات» نظرا OY‏ تقنية 
ضبط الجودة بالنسبة للمعلومات على الإنترنت» إن توافرت» فإنها في أحسن الأحوال 
مفككة البنيان إلى حد بعيد (ك| هو الحال على سبيل المثال» حين| كانت فهرسة مصادر 
الإنترنت تتم للنظم القائمة على الأدلة). 

والبحثء. |S‏ ذهب برور )2001( Brewer‏ هو أبرز وأهم جوانب الإنترنت» 
بعد الاتصال. ونظم استرجاع الإنترنت مصممة على وجه التحديد» لأغراض 
الاسترجاع. يضاف إلى ذلك أن هذه النظم يتم التعامل معها بلا رسوم بالنسبة 
للمستفيد النهائي إذا منا توافرت له فعلا فرصة التعامل مع الإنترنت. ومن ثم فإنه لا 
مبالخة في القول Ob‏ نظم استرجاع الإنترنت تتبوأ مكانة بارزة في حقل استرجاع 
العلومات» في الوقت الراهن» وسوف تظل كذلك لزمن طويل في المستقبل. 

وعل الرغم من أن نظم استرجاع الإنترنت تبدو واعدة» وبشكل استثنائي في 
حقل استرجاع المعلومات» فإن التحديات التي تواجهها يمكن أن تظل بحاجة إلى 
المزيد من الجهد )2008 (Mayer,‏ وتعتقد ماريسا ماير “Marissa Mayer‏ نائب 
رئيس جوجل لنتجات عمليات البحث وخرات المستفيدين» أن البحث لا يتفق 
وقاعدة ۸٠-۲١‏ المعتادة". وإنما بقدر ما يتعلق الأمر بجوجلء فإنه قد حل حوالي 4٠‏ 


(*) ينص مبدأ باريتو Pareto‏ الذي يعرف أيضا بقاعدة A-Y e‏ وقانون القلة الحيوية Vital‏ 
few‏ ومبدأ تشتت العوامل؛ على أنه بالنسبة لكثير من الوقائع» فإن حوالي ۰ من النتائج تتأتى 
من ۲١‏ من الأسباب. وقداقترح جوزيف إم. جوران Joseph M. Juran‏ استشاري- 


317 


بالمئة من مشكلات البحث» إلا أن العشرة بالمئة الأخيرة» من حلول مشكلات البحث 
تمثل أكثر من ١‏ بالمئة من العمل. وتشمل أمثلة المشكلات في العشرة بالمئة CB pSV‏ 
البحث المتنقل أو الجوال mobile search‏ (ب) في ذلك الأجهزة القابلة للارتداء أو 
الحمل «(wearable‏ وبحث الأصوات. واللغة الطبيعية» وبحث الوسائط المتعددة 
gil‏ بع Ls Jal‏ افا ة غل agg peel‏ رشان ell‏ القن تتم ى وسا 
(كالصور ومقاطع الفيديو) التي تعد أكثر ملاءمة للمستفيد. ومن هذا المنظور. لا 
يزال أمام نظم استرجاع الإنترنت كفئة» شوط طويل» يمكن أن تقطعه في حقل 
استرجاع المعلومات. 


نظم استرجاع المعلومات: بعض الاتجاهات: 

شهدت العقود الأخيرة نمو نظم استرجاع المعلومات» وتطورها في أبعاد 
كثيرة. وقد أحدث العصر الرقمي» وخصوصا تقنيات الشبكات» تغيرات في نظم 
استرجاع المعلومات» التي لم تعد تعمل بمعزل بعضهما عن بعض» تبعا لنوعية النظم» 
وإنما لا تعمل هذه النظم بعضه| عن بعض » في حدود إحدى فئات نظم استرجاع 
المعلومات فحسب» (كنظم الخط المباشر مثلا) ily‏ تندمج أيضا عبر خطوط 
حدودها. ومن ناحية أخرى تتيح تطبيقات الجيل الثاني للعنكبوتية الناشئ (كالتمييز 
الاجتماعي والموسوعات المصغرة Wikis‏ على سبيل المثال) للمستفيدين القدرة على أن 
يصبحوا مساهمين في استرجاع المعلومات» ومن ثم فإنهم لا يكتفون بمجرد الانتظار 
على الطرف المتلقي في عملية تنظيم المعلومات واسترجاعها. ونكرس الأقسام الفرعية 
التالية لحذين الاتجاهين فيم| يتعلق بنظم استرجاع المعلومات. 


-إدارة الأعمال» هذا المبدأء وأساه باسم رجل الاقتصاد الإيطالي فلفريدو باريتو Vilfredo‏ 
Pareto‏ الذي لاحظ عام ١۱۹۰ء‏ أن AAt‏ من الأراضى يمتلكها ٠‏ من السكان. (المترجم) 
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اندماج نظم استرجاع المعلومات: 

يتبين من المعالجات والمناقشات في هذا الفصل» أن لكل نوع من نظم استرجاع 
المعلومات ملامحه ومقوماته الخاصة. ووظائفه وإمكانياته في استرجاع المعلومات» وإن 
كانت جميع هذه النظم مصممة» وتدار لأغراض استرجاع المعلومات. وقد بدأت 
مؤخرا مختلف نظم استرجاع المعلومات تندمج» من أجل توفير خدمات استرجاع 
معلومات أفضل وأكثر ملاءمة للمستفيدين. ويمكن للاندماج أن يتخذ LÍ‏ من 
الأشكال التالية. 


والشكل الأول للاندماج» من الناحية التاريخية» هو تحميل نظم الأسطوانات 
المكتنزة على الفهارس المتاحة على الخط المباشر. ولما كانت هذه الأخيرة يتم إنشاؤها 
بوجه عام للمكتبات القائمة بذاتهاء التي تقتني أيضا نضا للأسطوانات المكتنزة» يقوم 
كثير من المؤسسات بدمج هذين النظامين معاء بعد أن تؤدي الفئة الأخيرة رسالتها 
كاملة. ويتم توفير روابط من الفهرس المتاح على الخط المباشر إلى الأسطوانات 
المكتنزة» الأمر الذي يمكن المستفيد من التعامل مع النظامين المختلفين لاسترجاع 
المعلومات في مكان واحد. كذلك تنشئ بعض المؤسسات روابط من فهارسها المتاحة 
على الخط المباشر» إلى نظم الخط المباشر» حتى يمكن التخلص من إجراءات الربط 
التي كان من الممكن أن تكون منفصلة عن بعضها البعض» عندما يكون المستفيد 
بصدد إجراء أي عمليات بحث على الخط المباشر. ويتم هذا الاندماج في الأساس عند 
مستوى الترابط بين النظم. 

ويحدث الشكل الثاني للاندماج عند مستوى محتوى مراصد بيانات النظم» 
وذلك بين الفهارس المتاحة على الخط المباشر ونظم الخط المباشر. فمن الممكن على 
سبيل المثال» لعملية بحث في الفهرس المتاح على الخط المباشرء أن تبين أن وعاء بعينه 
لا وجود له في مجموعات المكتبة» وحينئذ يمكن للاستفسار عن ذلك الوعاء أن يقدم 
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لنظام الخط المباشرء الذي يرتبط به الفهرس المتاح على الخط المباشرء لمعرفة ما إذا كان 
الوعاء في نظام الخط المباشر أم لا. ومن المرجح إلى حد بعيد» أن تستخدم نظم الإمداد 
بالوثائق document delivery‏ (مثل بروكوست (Proquest‏ للحصول على نسخة 
من الوعاء. إلا أن الرابطة بين الفهارس المتاحة على الخط المباشرء ونظم الخط ALI‏ 
هي التي تيسر فعلا عملية الاسترجاع. 

ويحدث النوع الثالث من الاندماج عندما يتزايد استخدام العنكبوتية فائقة 
البناء أو التنظيم ias hyperstructured‏ لنظم استر جاع الإنترنت. إلى جانبا 
استخدامها من أجل نظم الخط المباشر» ونظم الفهارس المتاحة على الخط المباشر. 
وتصبح نظم استرجاع المعلومات هذه مترابطة» بحيث يصبح ما بينها من حدود غير 
واضحة المعالم. فالحقل GAOT‏ مارك -MARC‏ على سبيل المثال» وهو مواصفة 
معيارية للفهرسة- يتم تخصيصه لتسجيل الأماكن الموحدة للمصادر URLs‏ الخاصة 
بمصادر الإنترنت. ويمكن للناتج النهائي لهذا الأسلوب أن يكون» كا بينا في القسم 
Y/Y // 8‏ فهارس متاحة على الخط المباشرء بالنسبة لمصادر الإنترنت. وفضلا عن 
ذلك هناك المزيد والمزيد من الكتب والدوريات التي تنشر إلكترونيا على العنكبوتية» 
وتتكامل مع مجموعات المكتبات» ويتم تمثيلها في الفهارس المتاحة على الخط المباشر. 
ومن ثم» فإن المعلومات المتوافرة على الإنترنت» التي كانت فيا مضى هدف نظم 
استرجاع الإنترنت بلا منازع» تشملها الفهارس المتاحة على الخط المباشر» التي كانت 
فيها مضى مخصصة كلية لتنظيم مجموعة المكتبات واسترجاعها. وقد أدى هذا 
الأسلوب إلى تحقيق الاندماج بين الفهارس المتاحة على الخط المباشرء ونظم استرجاع 
الإنترنت. ويمكن أن نجد مثالا آخر شل هذا الاندماج» [Re‏ تشتمل وثائق 
العنكبوتية على إشارات مرجعية أو استشهادات» تغطيها نظم الخط المباشر. وإذا 
افترضنا أن كانت إحدى وثائق العنكبوتية» إلى جانب استشهاداتها المرجعية» قد أمكن 
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العثور عليها بمساعدة أحد نظم استرجاع الإنترنت» فإنه يمكن للمستفيد أن يواصل 
البحث في نظام الخط المباشرء الذي يشتمل على الاستشهادات المرجعية المرتبطة 
بروابط فائقة. ويتحقق الترابط بين نظم الفط المباشرء ونظم استرجاع الإنترنت 
بسلاسة وبلا أدنى معوقات. 

ومن منظور أكثر اتساعاء فإن العنكبوتية في سبيلها OY‏ تصبح المنصة بالنسبة 
للتعامل مع مختلف فئات نظم استرجاع المعلومات. ومن وجهة نظر أقل اتساعاء فإنه 
ليس من المستبعد بالنسبة لمستفيد ماء أن يتعامل مع منظومة معلومات مكتبة قائمة على 
العنكبوتية» تشمل جميع أنواع نظم استرجاع المعلومات؛ أي فهرس المكتبة ا متاح على 
الخط المباشرء ونظم الخط المباشر التي تشترك فيها المكتبة» وبعض نظم استرجاع 
الإنترنت التي ترى المكتبة إتاحتها. فهل يمكن للعنكبوتية أن تصبح المدصة الوحيدة 
بالنسبة لنظم استرجاع المعلومات في المستقبل؟ هل يمكن لمنصة مشتركة أن تعمل على 
الحث على المزيد من الاندماج بين نظم استرجاع المعلومات؟ ما التأثير المحتمل 
للاندماج على المستفيد؟ لازلنا حتى الآن في انتظار إجابات هذه الأسئلة. 


الجيل الثاني للعنكبوتية ونظم استرجاع المعلومات: 

لقد كان لظهور تطبيقات الجيل الثاني للعنكبوتية 2.0 (Web‏ كالموسوعات 
المصغرة wikis‏ والتمييز الاجتماعي» ولاشكء تأثيره على تنظيم المعلومات 
واسترجاعها بوجه عام» وعلى نظم استرجاع المعلومات على وجه الخصوص. ففي 
القسم ٤/١/۲‏ ورد الجيل الثاني للعنكبوتية بوصفه عنصرا في مناقشة التمييز 
الاجتماعي (أو التميبز بإيجاز) ودوره في التكشيف: وفي سياق نظم استرجاع 
المعلومات بدأت المدونات» والتمييز» والموسوعات المصغرة» تحدث تأثيرا ملحوظا 
على عملية استرجاع المعلومات. 


فالمدونات عادة ما تستخدم في نطاق نظام استرجاع المعلومات» حتى يكون 
بإمكان المستفيد التعليق» على سبيل المثال» على الكتب التي اقتنتها إحدى المكتبات» أو 
المقالات المسترجعة من أحد نظم الخط المباشر. وتساعد رسائل المدونات من هذا 
النوع المستفيدين الأنداد في اتخاذ قرار ما إذا كان عليهم محاولة الاطلاع على مقالة 
بعينهاء أو مراجعة كتاب معين. وقد تم وضع الموسوعات المصغرة في نظم استرجاع 
المعلومات (مثل Search wiki‏ لجوج ل) للسماح للمستفيدين بوضع لمساتهم 
الشخصية على ما يسترجعه ويقدمه نظام استرجاع المعلومات» وذلك بالارتقاء . 
بالنتائج» وإضافة نتائج جديدة» وحذف نتائج قدمت من قبل» وتسجيل التعليقات 
(Notes, 2008b)‏ ويقودنا هذا التطبيق» على نحو ماء للاقتراب من تطويع طريقة 
تقديم نتائج عمليات البحث» كجزء من إضفاء الطابع الشخصي على البحث. وبناء 
على طبيعته الفريدة؛ يتزايد على نحو مطرد. إدخال التمييز في نظم استرجاع 
المعلومات» كوسيلة لتوفير نقاط وصول إضافية من وجهة نظر المستفيد. وقد بداً 
ظهور نظم استرجاع المعلومات التي تنطوي على تطبيقات الجيل الثاني للعنكبوتية 
‘Web 2.0‏ فتو كولاب في إلزفير collab at Elsevier‏ 2« على سبيل JUN‏ وهو 
شريك رئيس في نظم الخط المباشر» منصة لاسترجاع المعلومات» تكفل للمتعاملين 
معها الاستفادة من التمييزء والموسوعات المصغرة» وماياثلها من تطبيقات 
العنكبوتية + cY.‏ أثناء التعامل مع نظمها على LA‏ المباشر (مثل ساينس دايركت 
(Science Direct‏ وسوباكس | «(Social OPACs) SOPACS‏ وهي نظم فهارس 
متاحة على الخط SUI‏ يخواص العنكبوتية (Blyberg, 2008; Stephens, Y.*‏ 
)2007 على الرغم من وجود قليل من التطبيقات. 
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وما يمكن أن يسفر عنه تكامل نظم استرجاع المعلومات وتقنيات العنكبوتية 
٠‏ فعلاء في حقل تنظيم المعلومات واسترجاعهاء مجرد احتمالات. إلا أن هناك أمرا 
واحدا يتضح فعلا بجلاء؛ فا مستفيدون يبدون متحمسين فعلاء فيم| يتعلق بقدرتهم 
على الإسهام في استرجاع المعلومات» بين| بدأ دارسو النظم واختصاصيو المعلومات 
النظر على نحو جاد في سبل جعل هذا التكامل ذا قيمة بالنسبة لكل 
الأطراف المشاركة. 
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الفصل الناسع 


استرجاع المعلومات الفريدة في محتواها 
أو في شكلها 


لقد استكشفنا حتى الآن موضوع استرجاع المعلومات» مفترضين أن المعلومات 
في المقام الأول نصوص بالإنجليزية» ولا بنيان خطي. ويركز هذا الفصل على استرجاع 
المعلومات الفريدة في محتواها أو في شكلهاء أي المعلومات متعددة اللغات» ومعلومات 
الوسائط المتعددة» ومعلومات النصوص الفائقة أو الوسائط الفائقة. 


المعلومات متعددة اللغات 

هناك ما يقارب من 5417 لغة حية في dL‏ من بينها ۲٠۹۲‏ تستعمل في 
أفريقياء و7١٠٠‏ في الأمريكتين» و79١١‏ في آسياء و۲۳۹ في أوروياء و١٠1١‏ في 
Lol!‏ المادئ (15 .م ,2005 (Gordon,‏ وبناء على تقدير أعد في فبراير عام ٩۱۹۹ء‏ 
كانت اللغات الأولى الثلاث المتربعة على القمة» في العام في ذلك الوقت» هي الصينية 
التقليدية المبسطة AAO) Mandarin Chinese‏ مليون ناطق ہا)ء والإسبانية PEY)‏ 
مليون ناطق Cle‏ والإنجليزية YYY)‏ مليون ناطق بها) )2000 eng (Sands,‏ يمكن 
لبشر في حياتهم اليومية» الاعتماد على لغتهم الأم دون سواهاء فإن العالم أحادي اللغة 
زائل حتما في هذا العصر الرقمي» بقدر ما يحظى تنظيم المعلومات واسترجاعها 
بالاهتام؛ نظرا OY‏ المعلومات يتم تسجيلها وتبادها بلغات متعددة» في شتى أنحاء 
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العالم» بها في ذلك الإنترنت. ومن ثم فإن الحاجة إلى تنظيم واسترجاع المعلومات 
متعددة اللغات» تصبح ضرورية» حتى وإن كان من الممكن للغة واحدة أن تكون لها 
السيطرة في وسط معين» إذا ما كانت تلك اللغة هي ما يستعملها معظم البشر هناك. 
وبعبارة أخرى OB‏ بيئة تنظيم المعلومات واسترجاعها برمتهاء ينبغي أن تكون متعددة 
اللغات» لتلبية الاحتياجات المعلوماتية لمختلف فئات المستفيدين الذين يتحدئون 
i ake OLS‏ 


ولقد كانت الإنجليزية هي اللغة الرئيسة للاتصال العلميء منذ الحرب ALLI‏ 
الثانية» ولا تزال في الصدارة بين جميع اللغات المستعملة على الإنترنت حتى الآن. ومع 
ذلك فإن الفجوة بين الإنجليزية واللغات الأخرى (كالصينية والإسبانية على سبيل 
المثال)» تتراجع بسرعة في أوساط المتعاملين مع الإنترنت. وكما ذهبت مجموعة 
مينيواتس للتسويق )2009( «Miniwatts Marketing Eroup‏ على سبيل JL‏ 
فإن لغات القمة الثلاث التي تستعمل على الإنترنت» كانت الإنجليزية (۲۸.۷ (ELL‏ 
والصينية CGAL 7١.1‏ والإسبانية ۸.٠(‏ با مئة)» وذلك في يوني و عام ۲٠٠۹‏ وفي 
مقابل ذلك كانت النسبة المئوية للمعلومات بالإنجليزية أعلى بكثير» عندما انطلقت 
الإنترنت جماهيريا في مطلع العقد الأخير من القرن العشرين. ويدل هذا التغير على 
حقيقة أن الإنترنت في سبيلها على الأقل» OY‏ تصبح متعددة اللغات على نحو أكثر. 

وينبغي للمعلومات متعددة اللغات أن يتم ترميزها للتجهيز بواسطة 
الحاسبات» قبل أن يكون من الممكن تنظيمها واسترجاعها رقمياء واليونيكود 
Unicode‏ مواصفة معيارية وضعت خصيصالمثل هذه الأغراض» بحيث يكون من 
الممكن ترميز أو تكويد كل حرف أو رمز في أي لغة» برقم فريد بالبايت» بصرف النظر 
عن المنصة أو التطبيق (Unicode, Inc.,2008)‏ وفي زمن ما قبل اليونيكود. OLS‏ 
لكل لغة نظام التكويد الخاص tle‏ على نحو يجعل التشغيل التبادلٍ led‏ بينها ضربا من 
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المستحيل. فقد كان الآسكي ASCH‏ (الكود المعياري الأمريكي لتبادل المعلومات 
Climeriean Standard Code for Information Interchange‏ الشهير» 
مصم] لتكويد الهجائية الإنجليزية» ولكنه لا يستطيع معالجة الأحرف في اللغات 
الأخرى (كالصينية مثلا). كما اتضح أيضا أن اليونيكود ضرورة بالنسبة لتطور 
الإنترنت؛ نظرا للمعلومات متعددة اللغات» التي تعالجها الشبكة الكونية معالجة 
الأحرف في اللغات الأخرى (كالصينية مثلا). كا اتضح أيضا أن اليونيكود ضرورة 
بالنسبة لتطور الإنترنت؛ نظرا للمعلومات متعددة اللخات» التي تعا لها الشبكة 
الكونية )2003 (Lerner,‏ واليونيكود ليس ضروريا في تكويد المعلومات متعددة 
اللغات للمزيد من التجهيز الرقمي فحسب» وإنما يكفل لمتصفح العنكبوتية القدرة 
على اكتشاف ما إذا كانت صفحة العنكبوتية الواردة أمامه» تستخدم إحدى خظطط 
التكويد المركبة فعلا على حاسب (Coyle, 2005) piati‏ ودعم eid‏ الوظيفة 
الأخيرة يلغي اليونيكود حاجة المتعامل لأن ينتقل يدويا من إحدى خطط التكويد 
(كالإنجليزية مثلا) إلى أخرى (كالصينية مثلا) عندما يكون بصدد النظر في معلومات 
متعددة اللغات كنتائج إحدى عمليات البحث مثلا. 


استرجاع المعلومات متعددة اللغات في الماضي: 

قبل ظهور الإنترنت» ونظم استرجاع الإنترنت» كانت المعلومات متعددة 
اللغات تدخل في نظم الخط المباشر» ونظم الأسطوانات المكتنزة» ونظم الفهارس 
المتاحة على الخط المباشر» على أساس انتقائي. وعادة ما تتبع هذه النظم سياسة للانتقاء 
في| يتعلق بتجميع المعلومات متعددة اللغات؛ فقد كان من الممكن على سبيل المثال» 
توفير مقومات الترجمة أو النقحرة Transliteration‏ إذا كان من المزمع إدخال لغة 
معينة. وفي نظم استرجاع المعلومات متعددة اللغات» لم يكن العثور على المعلومات 
باستعمال اللغة نفسها التي سجلت بها المعلومات (كالبحث عن المعلومات الصينية 
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باستعمال استفسارات بالصينية على سبيل المثال) فيا يبدو يحظى بالدعم على نطاق 
واسع» على الرغم من أنه كانت هناك بعض الاستثناءات. ويمكن القول بوجه عام أن 
المعلومات باللغات الأجنبية كانت تنقحر لأغراض الاسترجاع في الفهارس المتاحة 
على الخط المباشر. وغالبا ما تستعمل نظم الخط المباشر» ونظم الأسطوانات المكتنزة» 
لغة أولى لتنظيم معلومات اللغات الأجنبية (في التكشيف والاستخلاص على سبيل 
المثال): وكان من الممكن استرجاعها [ed‏ بعد باللغة الأولى نفسها. 

وهناك نظم مصممة لاسترجاع المعلومات متعددة اللغات مباشرة» بدلا من 
استرجاعها عن طريق الترجمة والنقحرة؛ فالفهارس المتاحة على الخط المباشرء في 
الصين على سبيل المثال» عادة ما تدعم طريقتين لغويتين» إحداهما للغة الصينية» 
والأخرى لما يسمى اللغات الغربية» كالإنجليزية والفرنسية مثلا. وبإمكان المتعاملين 
استعمال الصينية على سبيل LU‏ لاسترجاع المعلومات بالصينية» والإنجليزية 
لاسترجاع المعلومات بالإنجليزية. وكان من المفترض في نظم استرجاع المعلومات 
متعددة اللغات» أن تسفر عن نتائج أفضل من تلك التي تعتمد على الترجمة والنقحرة» 
OY‏ النظم متعددة اللغات بإمكانها تجنب إدخال المزيد من مظاهر التفاوت أو 
الاختلاف» التي يمكن أن تنجم عن الترجمة أو النقحرة» في عملية الاسترجاع. 
استرجاع المعلومات متعددة اللغات على الإنترنت: 

على الرغم من أن نظم الخط المباشرء والأسطوانات المكتنزة» والفهارس المتاحة 
على الخط المباشرء تجمع معلومات متعددة اللغات» OB‏ الحاجة إلى استرجاع المعلومات 
متعددة اللغات في تلك البيئات» لا تبدو قوية كا هي على الإنترنت» نظرا للعوامل التالية: 
أولاء أن تغطية المعلومات متعددة اللغات في تلك النظم» كانت انتقائية إلى حد بعيد» كم| 
تقتصر على المعلومات عالية الجودة. ثانياء أن الإنترنت شبكة كونية للشبكات» ومن 
الطبيعي أن تحمل معلومات متعددة اللغات» أكثر بكثير من الأنواع الأخرى من نظم 
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استرجاع المعلومات. LSE‏ يسهم غياب تدابير ضبط الجودة» كم بينا في القسم 
١ 16/۸‏ كذلك في ازدهار المعلومات متعددة اللغات على الإنترنت. 

Ley‏ لاشك فيه أن الإنترنت» كبيئة لاسترجاع المعلومات» تختلف عن البيئات 
الأخرى لاسترجاع المعلومات, نظرا لتعدد فئات أو اختلاف خصائص المتعاملين 
معها. وقد تكهن فالوز )2007( Fallows‏ عند الكتابة لمشروع إنترنت المقصورة 
والحياة الأمر يكية Pew Internet and American Life Project‏ أن يكون من 
الممكن للصين أن تحل محلى الولايات المتحدة الأمريكيةء في إجماالي عدد المتعاملين» في 
غضون سنوات قليلة. وقد تأكد هذا التكهن أسرع ما كان متوقعاء من جانب مركز 
معلومات شبكة الإنترنت الصينية China Internet Network Information‏ 
«Center (CNNIC)‏ عندما أعلن أن المتعاملين مع الإنترنت في الصين بلغ إجمالي 
عددهم ۲۹۸ ملیون» في نباية ديسمبر عام (CNNIC, 2008) ٠٠١‏ ويدل تقرير 
مركز معلومات شبكة الإنترنت الصيئية؛ إلى جانب البيانات الواردة من مجموعة 
مينيواتس للتسويق )2009 «(Miniwatts Marketing Group,‏ نيا يتعلق بعدد 
المتعاملين مع الإنترنت في دول كاليابان» وفرنساء وألمانياء يدل على أن الإنترنت تغادر 
كما يبدو ماضيها أحادي اللخة. وتتعامل نظم استرجاع الإنترنت مع قضية استرجاع 
المعلومات متعددة اللغات» إما بدعم عمليات البحث متعدد اللغات» وإما بتوفير 
مقومات الت رحمة التي طورتها شر کات مثل سيستران (www.systransoft.com)‏ 
|S SYSTRAN‏ كان لآلتافيستا AltaVista‏ الريادة في كل من المجالين» بالتعاون 
مع سیستران» [ey‏ حذت كثير من نظم استرلجاع معلومات الإنترنت الأخحرى (مثل 
جوجل) حذوه» وخصوصا في SLE‏ البحث متعدد اللغات. ٠‏ 

وعندما بدأ تطور نظم استرجاع الإنترنت» كانت الإنجليزية هي اللغة الوحيدة 
التي يمكن للمتعاملين استعالها للاسترجاع. وبمقدور هؤلاء المتعاملين البحث OV‏ 
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في الإنترنت» باستعمال أكثر من اثنتي عشرة لغة مختلفة» تشمل الإنجليزية» والصينية» 
والفرنسية» والألمانية» والإسبانية» والروسية. ومن الممكن إجراء البحث متعدد 
اللغات في الإنترنت بطريقتين؛ الطريقة الأولى هي إجراء البحث باستعمال أحد نظم 
استرجاع الإنترنت المصمم خصيصا للغة معينة (مثل ياهو! في فرنسا) وذلك 
باستفسارات بحث بتلك اللغة. والطريقة الثانية هي قصر نتائج البحث على لغة 
بعينهاء بانتقاء اللغة التي يقع عليها الاختيار» الواردة على الصفحة الرئيسة لأحد نظم 
استرجاع الإنترنت. ؤيظل استفسار البحث بالإنجليزية على سبيل المثال» إلا أن 
النتائج يمكن أن تكون باللغة المحددة (كالإسبانية مثلا). وينبغي للاسترجاع من هذا 
النوع» أن ينظر إليه» بالمعنى الدقيق» بوصفه استرجاعاً للمعلومات عبر اللغات» الذي 
نعالجه في القسم 4/ YN‏ 

وفضلا عن البحث متعدد اللغات» يمكن الحصول على المعلومات متعددة اللغات 
على الإنترنت بواسطة الترجمة» وذلك بفصل الجهود المشتركة التي BIS‏ نظم استرجاع 
الإنترنت» وشركات برمجيات الترجمة الآلية. وتضافر الجهود بين التافيستا Altavista‏ 
وسيستران SYSTRAN‏ مثال على ذلك؛ فمن الممكن على سبيل المثال» ترجمة أي نتائج 
يتم استرجاعها بواسطة آلتافيستاء من الإنجليزية» إلى الصينية» أو الفرنسية» أو الألانية» أو 
الإيطالية» أو اليابانية» أو الكورية» أو الإسبانية» أو البرتغالية» والعكس صحيح» وذلك 
باستعمال برمجيات سيستران» وإن كانت جودة الترجمة ليست مرضية تماما؛ نظرا لأوجه 
القصور الكامنة في الترجة الآلية )1999 «Balkin,‏ 


البحث حول استرجاع المعلومات متعددة اللغات: 
اجتذب استرجاع المعلومات متعددة اللغات اهتام الباحثين في السنوات 


الأخيرة» وأصبح مساراً (أي مشكلة فرعية بعينها للاسترجاع في ترك ٤‏ حتى ترك 1 
.CTREC-4 through TREC-6‏ وقد تناول المسار متعدد اللغات بالدرس» قضايا 
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استرجاع المعلومات بلغات غير الإنجليزية. وقد تمت دراسة الإسبانية والصينية» 
اللغتين غير الإنجليزيتين المستخدمتين على أوسع نطاق )2005 (Gordon,‏ من 
جانب أكثر من عشرين فريقا للبحث» من عام ۱۹۹٩‏ حتى عام 14917. وتبين 
للباحثين )2000 (Spärck Jones,‏ أن: 
يبدو الامتداد إلى الإسبانية متعددة اللغات متواضع نسبياء 
أما إلى الصينية فأكثر إلحاحا لتغطية نظام كتابة يختلف اختلافا 
جوهريا. ومن ثم فإنه يثير قضية ما إذا كان في التطبيق؛ في مقابل 
المبادئ الساس» أن طرق التكشيف والبحث التي تطورت 
للإنجليزية» كتلك التي تستخدم الأساليب الإحصائية؛ يمكن أن 
تنتقل إلى لغات أخرى مختلفة Oly ULE‏ تكون فعالة بالنسبة لتلك 
اللغات. (46 (P.‏ 
وتتطلب اللغات المختلفة بالفعلء نظم استرجاع معلومات بإمكانيات مختلفة» 
لمعا لجة خصائصها المميزة. فمن المهام المثيرة للتحديات إلى حد بعيد؛ على سبيل المثال» 
تحليل النص الصيني آليا إلى مصطلحات استفسار لما دلالتها؛ نظرا لأنه لا يوجد فراغ 
بين الكلمات في الكتابة الصينية إلا في le‏ الجملة. ومن ثم» قارنت معظم فرق 
البحث المشاركة في مسار الصينية متعددة اللغات في ترك -1 TREC-6‏ طرق تحليل 
مختلفة )2000 (Voorhess & Harman,‏ والبحث بمراعاة شكل الحرف الأول» 
وهو من الأساليب الرئيسة لاسترجاع المعلومات في الإنجليزية» غير قابل للتطبيق في 
الصينية» نظرا لأنه ليست هناك حروف كبيرة أو صغيرة في النص الصيني. 
والمجال المتصل بالاسترجاع متعدد اللغات» هو البحث عبر اللغات Cross-‏ 
language‏ الذي تتوزع فيه الوئائق على عدة لغات a ples VIS)‏ أو الألمانية» أو 
الفرنسية» أو الإيطالية على سبيل (JEU‏ وتصاغ الاستفسارات بكل لغة من هذه 
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3 
اللغات. وقد أضيف مسار استرجاع المعلومات عبر اللغات Cross-Language‏ 
Information Retrieval (CLIR)‏ إلى سلسلة مؤتمرات استرجاع النصوص 
¿Text REtrieval Conference (TREC) `‏ عام ۷ء بدءا بتر 1-3 
TREC-6‏ حتى ترك ۲۰۰۲ 2002 TREC‏ والهدف الرئيس لمسار استرجاع 
المعلومات عبر اللغات» هو استرجاع الوثائق بإحدى LAU!‏ المستهدفة» باستعمال 
استفسارات مكتوبة بلغة أخرى مختلفة. وفي ترك-٦»‏ جربت ثلاث عشرة مجموعة 
مشاركة في مسار ple fal‏ المعلومات عبر اللغات» ثلاثة طرق رئيسة للاسترجاع عبر 
اللغات» هي: )١(‏ الترجمة الآلية» التي كانت تترجم بها الاستفسارات أو الوثائق إلى 
اللغة المستهدفة» (Y)‏ استعمال معاجم ثنائية اللغة قابلة للقراءة بواسطة الحاسبات» أو 
أي مصادر لغوية أخرى قائمة» و(7) استعمال رصيد من المصادر لاختبار طريقة 
الاستر جاع عبر اللغات أو لتمكينها(2000 35.(Voorhess & Harman,‏ حدود 
ما مهم القضايا التقنية لاسترجاع المعلومات عبر اللغات CLIR‏ استعرض كيشيدا 
Kishida (2005)‏ تفصيلاء إجراءات الترجمة» وطرق فك غموض الترحمة. 
واستراتيجيات المضاهاة» ضمن جهود أخرى كثيرة بذها الباحثون في استرجاع 
المعلومات عبر اللغات على مر السنين. 
وقبل أن ينتهي ترك TREC‏ من مسار استرجاع المعلومات عبر اللغات 
CLIR‏ فی عام 2٠٠١7‏ ظهرت منصتان رئيستان أخريان لاسترجاع المعلومات عبر 
اللغات؛ والمنصة الأولى هي منتدى التقييم عبر اللغات Cross-Language‏ 
Evaluation Forum (CLIF;www.clef-campaign.org)‏ الذي هيدف إلى 
تشجيع البحث والتطوير في الوصول إلى المعلومات متعددة اللغاتء من المنظور 
الأوروبي في الام الأول والمنصة الثانية هي مجموعة اختبار المعهد الوطني 
للمعلوماتية لورش عمل نظم استرجاع المعلومات National Institute of‏ 
«Informatics, Test Collection for IR Systems (NTCIR) Workshop‏ 
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ومقرها aLSl¢ s .(research.nii.ac.jp/ntcir/online/prop-en.html) OLUL‏ 
لسلسلة ترك (TREC‏ صممت ورش عمل نظم استرجاع المعلومات 
NTCIR Workshops‏ لتشجيع البحث في تقنيات الوصول إلى المعلومات. بم في 
ذلك استرجاع المعلومات. واسترجاع المعلومات عبر اللغات» أحد المهام البحثية التي 
تنهض جا ورش عمل مجموعة اختبار نظم استرجاع المعلومات بالمعهد الوطني 
للمعلوماتية *2/16011. وتشمل اللغات غير الإنجليزية التي تحظى بالاهتام بانتظام 
في ورش العمل تلك» اليابانية» والصينية» والكورية. ويعمل كل من منتدى التقييم 
عبر اللغات CLEF‏ ومجموعة اختبار المعهد الوطني للمعلوماتية NTCIR‏ همة 
ونشاطء على استكشاف المشكلات التي يعاني منها استرجاع المعلومات عبر اللغات. 
وعلى الرغم من تأسيس كل من مؤتمرات استرجاع النصوص TREC‏ ومنتدى 
التقييم عبر اللغات CLEF‏ ومجموعة اختبار المعهد الوطني للمعلوماتية ONTCIR‏ 
يتم الإعراب عن المخاوف فيا يتعلق plea VL‏ الملائم بكثير من اللغات التي BEY‏ 
بالتغطية في تلك المشروعات» وتوسعة العنكبوتية متعددة اللغات» بالإضافة إلى 
الإنتاج الفكري خلاف المعلومات الإخبارية )2005 .(Gey, Kando & Peters,‏ 
وللتعامل مع تلك المخاوف» يحاول باحثو مسار استرجاع المعلومات عبر اللغات 
CLIR‏ على نحو متزايد» اختبار مثل هذه الطرق الخاصة بمعالجة اللغة الطبيعية» 
كالتقسيم الجماعي Copound splitting‏ والترجمة الآلية (من أمثال & Chen‏ 
(Gey, 2004, Hollink, et al., 2004; Si, et al., 2008‏ ويبدو أن الذكاء 
الاصطناعي ينهض بدور في هذه الجهود. 
وقصارى القول» فإن البحث متعدد اللغات» يعني أن تكون المعلومات 
المستهدفة» وكذلك الاستفسارات باللغة نفسهاء [ay‏ يعني الاسترجاع عبر اللغات أن 
تكون المعلومات المستهدفة» والاستفسارات بلغات مختلفة. وقصر نتائج البحث في 
الإنترنت على لغة واحدة بعينهاء |S‏ ذكرنا في 4/ /١‏ ۲ء في واقع الأمر» استرجاع عبر 
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اللغات؛ نظرا OY‏ الاستفسار ينبغي أن يترجم من إحدى اللغات إلى لغة المعلومات 
المستهدفة» قبل إجراء عملية البحث. وسواء كان الاسترجاع متعدد اللغات, أو عبر 
اللغات» OB‏ المتعاملين يتعين عليهم (Slo‏ الانتباه إلى خصائص اللغة التي سجلت بها 
المعلومات؛ نظرا لاختلاف كل لغة عن غيرها. ولا يمكن إلا من خلال هذا المنظور 
إنجاز الاسترجاع متعدد اللغات أو عبر اللغات بنجاح. 


المعلومات متعددة الوسائط: 

ely‏ على دراسة أجراها معهد إدارة ونظم المعلومات» بجامعة كاليفورنيا في 
بر School of Information Management and Systems, University Js‏ 
¿of California at Berkely (Lyman, et al., 2000)‏ ينتج العام مابين ۲-١‏ 
إكزابايت exabytes‏ (الإكزابايت الواحدة = بليون جيجا بايت) من المعلومات 
المختلفة سنويا. وعلى الرغم من أن تقرير الدراسة لم يحدد النسبة المئوية للمعلومات 
متعددة الوسائط من المجموع» فإن مقدار المعلومات متعددة الوسائط (كالنشرات 
الإخبارية» ومؤتمرات الفيديو» وبيانات الاستكشاف» والتسجيلات السمعبصرية 
للقائات الؤتساتة: والحاضرات الدزاينية Le‏ شيل AL Wy gate (SU‏ قى 
كبير؛ نظرا OV‏ العنكبوتية القابلة للتكشيف على الصعيد العام» وحدها كانت تشتمل 
على ما يقدر Hey‏ وثانين مليون صورةء أي ثلاث تيرابايت!) 
الصورء في فبراير عام 1444 (1999 (Lawrence & Giles,‏ ولا كانت العنكبوتية 
تواصل نموها السريع» وتحمل المزيد من المعلومات متعددة الوسائط op‏ الحاجة إلى 
العثور على هذه المعلومات والحصول عليهاء تزداد أيضا على نحو مطرد. 


5 من بيانات 


(*) التيرابايت تساوي تريليون بايت» أي ألف جيجا بايت. (المترجم) 
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وقدعرّفت الوسائط المتعددة» في الفصل الثالث» بوصفها أي جمع بين 
المعلومات الصوتية والمصورة والنصية» ويشتمل الشكل رقم ١/۳‏ على التقسيم 
الشجري للمعلومات متعددة الوسائط. وينبغي أن نلاحظ أن المصطلح ”صورة“ 
image‏ يستعمل أحيانا على نحو فضفاض» للدلالة على جميع أنواع الوسائط المتعددة؛ 
نظرا OY‏ كلا من الصور الثابتة والصور المتحركة» يمكن أن تشتمل على معلومات 
نصية» ey‏ يمكن للصور المتحركة أن تشتمل أيضا على معلومات صوتية: ولا كانت 
المعلومات النصية هي موضوع المناقشة في معظم أجزاء هذا الكتاب؛ فإن التركيز في 
هذا القسم ينصب على المعلومات غير النصية» التي تتكون من الصور الثابتة» 
والأصواتء والصور المتحركة. 
` وقد تطورت طرق وخوارزميات عدة لاسترجاع المعلومات متعددة الوسائط. 
إلا أنها تنقسم إلى فئتين عريضتين؛ هما النهج القائم على الوصف description-‏ 
«based approach‏ و النهج القائم على المحتوى .content-based approach‏ 
ويستخدم النهج القائم على الوصف» ببساطة» يدوياء العناوين الفرعية» والكلمات 
المفتاحية» أو غيرها من الواصفات (كاسم الفنان» وحجم العمل على سبيل ال مخال) 
الخاصة بالمعلومات متعددة الوسائط» لأغراض الاسترجاع. ويتدخل البشر بشكل 
مباشر في عملية الاسترجاع» عند اتباع هذا النهج. ومن ناحية أخرى يدل النهج القائم 
على المحتوى» على الأساليب التى تستند إلى التجهيز الآلي للمعلومات متعددة 
الوسائط نفسها. l‏ 
ويتم اتباع النهج القائم على الوصف» والنهج القائم على المحتوى» من جانب 
فئتين مختلفتين من الباحتين )2000 .(Cawkell, 1992; Chu, 2001; Persson,‏ 
ويبدو أن من ينتمون إلى مجال علم الحاسبات يركزون على النهج القائم على المحتوى» 
lew‏ تركز أوساط ple‏ المعلومات, ب) في ذلك علم المكتبات» على النهج القائم على 
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الوصف )1997 .(Cawkell, 1992; Rasmussen,‏ و gL‏ هذا التقسيم نتيجة 
لعاملين؛ Lol‏ اختلاف الخلفية الأكاديمية» وكذلك مقومات التدريب لكل من 
الفئتين من الباحثين؛ فأولاهما في علم الحاسبات والثانية في علم المعلومات. أما 
العامل الثاني فهو اختلاف طرق التجهيز التي تتبع بالنسبة لاسترجاع المعلومات 
متعددة الوسائط» في كل من النهجين؛ إذ أن النهج الأول آلي» والثاني يدوي. وتعالج 
الأقسام التالية كيف يتم تطبيق كل من النهجين في استرجاع الأنواع الثلاثة 
للمعلومات متعددة الوسائط» وهي الصور الثابتة» والأصوات» والصور المتحركة. 
استرجاع الصور الثابتة: 

تشمل الصورهء كما بينا في القسم ١/7/7‏ كلا من الصور الثابتة والصور 
المتحركة. وتشمل الصور الثابتة الرسوم والصور الضوثية» والملصقات «posters‏ 
وصور الوثائق (مثل ملفات صيغ الوثائق متعددة المنصات Portable Document‏ 
(Format (PDF)‏ وما شابه ذلك. ومن الممكن تقسيم الصور المتحركة» التي تشمل 
الصور الثابتة بالإضافة إلى الصور المتحركة إلى فتتين فرعيتين؛ الصور المتحركة 
المصحوبة بالصوت» التي تشكل أشرطة الفيديو أو الأفلام» والصور المتحركة بلا 
صوت» وهي الرسوم المتحركة أو الأفلام الصامتة. ولأغراض التوضيح» نناقش في 
هذا القسم الصور الثابتة فقط» (ey‏ نناقش الصور المتحركة في القسم V/V /٩‏ 

للصور الثابتة معناها الخاص وخصائصها التي تشكل الأسس بالنسبة لمهام 
الأداء أو الاسترجاع. (by‏ يتعلق بفنون عصر النهضة. يحدد بانوفسكي Panofsky‏ 
(1955) معالم ثلاث طبقات للمعاني بالنسبة للصور. والطبقة الأولى هي ما قبل 
صناعة التهاثيل أو Pre iconography OL aI‏ التي تصف المعنى الأولي أو 
الطبيعي للصورء وتنقسم Lal‏ إلى الجوانب الحقائقية factual‏ والتعبيرية 
|S rexpressional‏ هو JULI‏ على سبيل المثال» بالنسبة لصورة المدينة الصاخبة» إذ 
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وصف صور ما قبل صناعة الأيقونات خبرة عملية؛ فالمدينة والمشهد الصاخب على 
سبيل المثال» من السهل التحقق منههماء بالنسبة cyl TELS SY‏ شاهدوا مثل هذه 
الكيانات من قبل. أما الطبقة الثانية فهي صناعة الأيقونات» التي تحدد معام المعنى 
الثانوي» أو التقليدي الذي يتم تصويره في الصورة (كصورة روما في مقابل أي مدينة 
أخرى على سبيل المثال). ويتطلب التحقق التماثيلى الإحاطة بالمصادر الأدبية»:كالتآلف 
على سبيل المثال» مع ملامنح روما كمدينة. أما الطبقة الثالثة فهي دراسة الأيقونات أو 
الرموز الفنية ciconology‏ التى تمثل المعنى الجوهري أو القيمة الرمزية للصورة. 
ويتطلب التحقق من المعنى الجوهري للصور وتفسيره؛ الذي قلا يكون معروفا 
للفنان» وربا يكون مختلفا بشكل قاطع عن ذلك الذي قصد الفنان التعبير عنه بوعي- 
يتطلب ”حدسا تحليليا تركيبيا synthetic‏ مرتبطا بالسيكولوجية الشخصية“ 
(Panofsky, 1955, p. 41)‏ ومثل هذا المعنى ”يتم إدراكه بالتحقق من تلك 
الأسس التي تكشف عن الاتجاه الأساس لأمة ماء أو عصرء أو dab‏ أو ديانة؛ أو 
عقيدة فلسفية ما“ (30 .م ,1955 .(Panofsky,‏ فبالنسبة للبعضء على سبيل SLU‏ 
يمكن لزوما أن تعني مدينة ذات تاريخ ثري» بينها يمكن أن تعني لآخرين المكان الذي 
تقع فيه الفاتيكان» والمعنى الجوهري للصورء كا يبدو هو الأصعب في تفسيره. ومن 
الممكن للتفسير أن يكون مغرقا في الذاتية» إذ يتوقف على خيرة المرء وخلفيته. 

وبعد نصف قرن من بانوفسکو Panofsky‏ تقريباء قسّم إيكنز وجراهام 
Eakins and Graham (1999)‏ خصائص الصور إلى BG‏ مستويات من التعقد 
المتزايد» ففي المستوى الأول تكون الخصائص ملامح بدائية كاللون» والنسيج» 
والشكل. ومثال استفسارات الاسترجاع القائمة على خصائص صور المستوى الأول 
المثلث الأحمر cred triangle‏ حيث “AN‏ يدل على اللونءو يوحي 


343 


ESE”‏ بالشكل. وخصائص صور المستوى الثاني ملامح منطقية» تتصل بهوية 
jee ot!‏ الضورة: وكيا للاقياء أن تكوة gan) dale‏ لكفيل غل مل 
المخال) أو محددة (كبرج ويليز (Willis Tower‏ الذي كان يعرف ببرج سيرز Sears‏ 
٣۴‏ في شيكاغوء .على سبيل المثال). وخصائص صور المستوى الثاني أكثر تعقدا 
من خصائص المستوى الأول؛ إذ يدل الأول منطقيا على هوية الموضوعات في صورة 
cls‏ أو يشتمل على معلومات تتجاوز حدود المستوى البدائي» فموضوع الصورة على 
سبيل JEL‏ مبنى إدأري» وليس شكلا أو نسيجا بعينه. وخصائص صور المستوى 
الثالث مجردة» وتنطوي على قدر لا يستهان به من الحجج أو البراهين» حول معنى ' 
وهدف الموضوعات أو المناظر الواردة في صورة ما )1999 .Eakins & Graham,‏ 
وتتصل هذه الخصائص ”بحيثيات “aboutness‏ أو محتوى أو مضمون الصورء 
كالجو الاحتفالي المصور في منظر حفل على سبيل المثال. 

ومن الممكن اكتشاف بعض مظاهر التشابه بين طبقات بانوفسكي Panofsky‏ 
الثلاث للمعنى بالنسبة للصور» وخصائص الصور ثلاثية المستويات التي اقترحها 
إيكنز وجراهام )1999( gies ,.Eakins and Graham‏ الطبقة الأولى في كلتا 
الحالتين ”با لخواص “ofness‏ أو الخصائص المادية للصورء إلا أن بانوفسكي أضاف 
الجانب التعبيري للصور في هذا المستوى» وم يحلل الصور إلى بكسلات Pixels‏ 
وهي المقياس الذي نشأ فيم) بعد بالنسبة للصور الرقمية. وتغطي الطبقتان الثانية 
والثالثة في كلا الخطتين الحيثيات أو المخصائص الموضوعية للصورء المتعلقة بمحتوياتها 
الدلالية. ومن الممكن التحقق من بعض الخصائص ال موضوعية بموضوعية (كتمييز 
روما عن:غيرها من المدن على سبيل المثال)» بين يمكن التأكد من البعض الآخر ذاتيا 
فقط (مثل روما بوصفها مدينة تاريخية أو مركزا دينيا). وأيا كانت الطريقة التي تقسم 


(*) أدق دقاتق النقاط التي تكون الصورة. (المترجم) 
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بها خصائص الصور إلى فئات» فإنها تشكل الأسس بالنسبة لاسترجاع معلومات 
الصور الثابتة» في كل من :بجي استرجاع الصور اللذين نناقشه| في بعد. 
استرجاع الصور الثابتة القائم على الوصف: 

يعتمد النهج القائم على الوصف لاسترجاع الصور الثابتة» الذي يعرف أيضا 
بالنهج القائم على ما وراء البيانات» أو القائم على المفهوم» أو القائم على النص - 
يعتمد على التوصيفات التي يوفرها اختصاصيو المعلومات. فمن الممكن وصف 
الصور الثابتة بسماتها أو خصائصها المادية (كصورة الدببة على سبيل (JEU‏ بالإضافة 
إلى حيثياتها أو خصائصها الموضوعية OUI, SIS)‏ المهددة بالانقراض مثلا). وغالبا ما 
تسمى مثل هذه التوصيفات le‏ وراء البيانات metadata‏ في أيامنا هذه؛ وقد أسمى 
ترانت )2004( Trant‏ نهج استرجاع معلومات الصور هذاء بالقائم على ما وراء 
البيانات. وإذا ما كانت التوصيفات تتعلق بالحيثيات فقطء فإننا يمكن أن نسمي نهج 
استرجاع الصور بالقائم على المفهوم (Rasmussen, 1997) Concept-based‏ 
وإذا ما كانت التوصيفات معدة بالنصوص المصاحبة للصورء فإننا يمكن أن نسمي 
نبج استرجاع الصور بالقائم على النص (Goodrum, 2000) text-based‏ وحینئذ 
تصبح هذه التوصيفات الأسنس بالنسبة لاسترجاع الصور الثابتة. 

وتستخدم كل من الكلمات المفتاحية واللغات المقيدة» في استرجاع الصور 
الثابتة» وغالبا ما تشتق الكلمات المفتاحية واللغات المقيدة» في استرجاع الصور الثابتة» 
وغالباً ما تشتق SIS‏ المفتاحية من العناوين الفرعيةء أو المعلومات النصية الأخرى 
الاح gual‏ القانة etka)‏ هرت of‏ قل مهن الصور bedeti‏ 
المخال). كذلك يمكن للمتعاملين اختيار مصطلحات الاستفسارات نفسها حين 
الاسترجاع. وتشمل اللغات المقيدة التي تستخدم في استرجاع الصور مكنز الفنون 
والعارة .Art and Architecture Thesaurus‏ وخطة تصنيف الفنون 


345 


والأيقونات ICONCLASS‏ ومكنز المواد التصويرية Thesaurus for Graphic‏ 
Materials‏ ويمكن العثور على المزيد من الوصف هذه اللغات المقيدة في راسموسن 
dy -Rasmussen (1997)‏ خطوة أكثر تقدما حلل جورجنسن Jorgensen‏ 
)2003( خصائص هذه اللغات المقيدة (الموضوعات والبشر على سبيل المثال)» من 
حيث توزيع تكرارهاء لمساعدة المتعاملين على الإحاطة بتطبيقها على نحو أفضل. 
كذلك تمت تجربة المكانز المرئية التي تستعمل البدائل ASU‏ بالإضافة إلى التعبيرات 
اللفظية» لأغر اض استرجاع dey pati‏ بعض الحالات ;1994 (Mostafa,‏ 
Rasmussen, 1997)‏ وتبدو هذه الطريقة ale‏ للاستفسار بالمثال» وهو أسلوب 

للاسترجاع» نوقش بإيجاز في القسم 0/ /١‏ ۲/ ۳ الخاص بتوسعة الاستفسارات. 


وبالإضافة إلى استرجاع الصور بناء على حيثياتهاء أو خصائصها الموضوعية» 
هناك الكثير من الخصائص الذاتية للوصول إلى الصور الثابتة» باتباع النهج القائم على 
الوصف. والتاريخ» والحجم» ونوع الصورة مجرد أمثلة قليلة. ولا تختلف عمليات 
البحث من هذا النوع كثيراء عن البحث بال حقل في استرجاع المعلومات النصية. ولا 
تزال التقنيات التي تطورت لاسترجاع المعلومات النصية (كالبحث البوليني» والبتر 
على سبيل المثال) قابلة للتطبيق في استرجاع الصور الثابتة» مع النهج القائم على 
الوصف. ويكمن الاختلاف الرئيس بين استرجاع النصوص واسترجاع الصور. في 
تعريف الحقول أو تحديد معالمها؛ فالحقول في استرجاع الصور الثابتة» يتم تحديد 
معالمها تبعا لخصائصن الصور لا وفقا jailed‏ المعلومات النصية. 

ومع ذلك فإن نبج استرجاع الصور القائم على الوصف» يرث جميع المشكلات 
المرتبطة بالتدخل البشري في العملية» كعدم الاطراد والتكلفة المرتفعة. يضاف إلى ذلك أنه 
لا مفر من الذاتية subjectivity‏ في تفسير حيثيات الصورء وعلى درجة أكثر ارتفاعا Le‏ 
هي عليه الحال في استرجاع النصوص؛ نظرا OY‏ تفسير حيثيات الصور أو محتواها 


` 346 


الموضوعي يتوقف بشكل كبيرء على خبرة المرء الشخصية وخلفيته؛ فمن الممكن على 
سبيل المثال» لكأس النبيذ في صورة ماء أن يكون دليلا على الاحتفال بالنسبة لشخص 
ماء بينم هو رمز السكر بالنسبة لآخر. وقد لا تشتمل الصور نفسها على مفاتيح صريحة 
للتفسير. وقد دخل النهج القائم على المحتوى إلى JLE‏ استرجاع الصورء جزئياء 
للتغلب على مشكلة اتباع النهج القائم على الوصف ode‏ وتشمل العوامل الأخرى 
التي أسهمت في ظهور النهج القائم على المحتوى» تطور التقنيات» ونمو معلومات 
الصور في العصر الرقمي, | 
استرجاع الصور الثابتة القائم على المحتوى: 

يتم اتباع النهج القائم على المحتوى لاسترجاع الصور الثابتة» dd ben‏ 
خصائص الصور المحددة في الاستفسارات آلى. وهذه الخصائص مشتقة من محتويات 
الصورة» ومن هنا سمي هذا النهج بالنهج القائم على المحتوى. وکا بينا في ١/۲/۹‏ 
فإنه يمكن تقسيم خصائص الصور إلى مستويين أو طبقتين مختلفتين & (Eakins‏ 
Graham, 1999; Panofsky, 1955)‏ إلا أن نظم استرجاع الصور باتباع النهج 
القائم على المحتوى» لا تعمل في الوقت الراهن بأقصى فاعلية: إلا في المستوى الأول 
فق ط» أي املاح البدائية للصور كاللون» والنسيج» والشكل & (Eakins‏ 
.Graham, 1999)‏ 

والمضاهاة هي التقنية الأساس في أي عملية للاسترجاع» واسترجاع الصور 
الثابتة بالنهج القائم على المحتوى ليس استثناء؛ فخصائص الصور المحددة في 
الاستفسار ينبغي أن تضاهي تلك الخصائص الممثلة في نظام استرجاع الصورء لكي 
يكون من الممكن الحصول على أي نتائج. وقد تم شرح المضاهاة الأساسء أو تقنية 
الاسترجاع بالنسبة للصور الثابتة بناء على اللون» والنسيج» والشكل» بوضوح 
واستفاضة في إيكنز وجراهام )1999( Eakins and Graham‏ وإن OLS‏ من 
الممكن لتطبيقات بعينها أن تنطوي على بعض الاختلافات. 


347 


ويستند استرجاع الصور الثابتة باللون إلى الرسوم البيانية histogram‏ 
للألوان؛ إذ يتم تحليل كل صورة يشملها النظام» لحساب الرسم البياني للون» الذي 
يبين نسبة بكسلات pixels‏ كل لون قي الصورةء ثم يتم بعد ذلك اختزان الرسم 
البياني لألوان كل صورة في النظام للاستخدام في المستقبل. وبإمكان المتعامل» أثناء 
البحث» إما تحديد النسبة المرغوبة لكل لون LT)‏ أبيض» و٠٠‏ بالمئة أزرق» و٠٤‏ 
بالمئة برتقالي» على سبيل المثال) وإما تقديم صورة كمثال (أي الاستفسار (LMG‏ يتم 
منها حساب رسم بياني آخر للألوان. وبأي من الطريقتين تتم المضاهاة لاسترجاع 
تلك الصورء التي تضاهي الرسوم البيانية لألوانها تلك الرسوم البيانية للاستفسار إلى 
أقصى حد. ومن الممكن للنتائج التي يتم الحصول عليهاء من بعض نظم استرجاع 
الصور باللون» أن تبدو مثيرة للإعجاب Eakins & Graham, 1999) Sus‏ 

ويستند استرجاع الصور الثابتة بالنسيج إلى الخنصائص النصية textual‏ 
كالتباين contrast‏ والاتجاهية directionality‏ وقد اتبعت أساليب متنوعة لقياس 
التشابه النصى بين الاستفسارات والصور المختزنة. فبادئ ذي بدء» تحسب هذه 
SLAY‏ للمعان brightness‏ النسبي لثنائيات بكسلاث pairs of pixels‏ منتقاأة 
من كل صورة» ثم يتم بعد ذلك حساب مقاييس أخرى لنسيج الصورة» كدرجة 
التباين» ومدى الخشونةء والاتجاهية» والانتظام (أو الدورية) والعشوائية. ومن 
الممكن صياغة استفسارات النسيج بطريقة ممائلة لتلك التي تصاغ بها استفسارات 
اللون» باختيار أمثلة من الأنسجة المرغوبة من لوحة الألوان pallette‏ أو بتوفير 
صورة استفسار كمثال. ويسترجع النظام صورا بمقاييس نسيج ممائلة في قيمتها إلى 
أبعد حد للاستفسار. واسترجاع الصور بالنسيج مفيد بوجه خاص في التمييز بين 
مناطق الصور ذات الألوان المتشامة (كالسماء والبحرء أو الأوراق والحشائش على 
COM‏ 
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وقد تناول ستكس )2006( Stix‏ بالوصف» تقنية ترتبط ارتباطا وثيقا 
باسترجاع الصور الثابتة بالنسيج؛ إذ يتم أولا تحليل كل صورة في نظام استرجاع 
معلومات الصورء بواسطة الحاسبات» للتحقق من الخصائص المميزة التي تتكون من 
مناطق داكنة dark‏ محاطة بمناطق ناصعة light‏ أو العكس» ثم يتم بعد ذلك تجميع 
بعض الخصائص معا في مجموعات ثلاثية» بناء على حساب المسافة الفاصلة بين كل 
خاصية وأخرى. وتمثل كل خاصية النقطة المركزية وهي بقعة مربعة مكونة من ٠١‏ × 
٠‏ بكسلات. ويسمى تجميع ثلاث بقع» ثلاثية gta) triplet‏ اختزان مكان کل 
ثلاثية كمدخل في جدول ضخم» مصمم للحد قدر الإمكان» من كم العمليات 
الحسابية اللازمة للبحث عن أي مدخل بعينه. كذلك يتم تقسيم صورة الاستفسار إلى 
ثلاثيات» بطريقة ممائلة لتلك الخاصة بتجهيز الصور المستهدفة. ويتم في النهاية 
مضاهاة ثلاثيات صورة الاستفسار مقابل تلك الثلاثيات الموجودة في الجدول» في 
أثناء عملية الاسترجاع. 


ويستند استرجاع الصور الثابتة بالشكل» إلى شكل الشيء أو الموضوع. إلا أنه 
مستقل عن الحجم أو الاتجاه؛ إذ يتم حساب عدد من الخصائص المرتبطة بشكل 
الموضوع» لكل موضوع يتم التحقق منه. في كل وثيقة مختزنة. وهناك نوعان رئيسان 
لخصائص الشكل» عادة ما يستخدمان: )١(‏ ا لخصائص العامة أو الشاملة global‏ 
5 كنسبة العرض إلى الارتفاع والدائرية» (؟) الخصائص الموضعية local‏ 
كمجموعات القطاعات الحدودية المتوالية. والاستفسارات التي تقدم لنظم 
الاسترجاع بالشكل» إما أن تكون نماذج صور أو خططات يرسمها المتعامل مع 
النظام. ويتم الرد حينئذ على الاستفسارات» بحساب مجموعة الخصائص نفسها 
ا لخاصة بصورة الاستفسارء واسترجاع تلك الصور المختزنة التي تضاهي خصائصهاء 
تلك الخصائص الخاصة بالاستفسار إلى أبعد حد. 
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ويبدو النهج القائم على المحتوى» باللون والنسيج والشكل» قادرا على تقديم 
نتائج مفيدة» على الرغم من أن بعض الخصائص قد أثبتت أنها أكثر فاعلية من غيرها 
بكثير )1999 (Eakins & Graham,‏ ومن المسلم به بوجه عام» أن استرجاع اللون 
واسترجاع الملمس» يسفران عن نتائج أفضل من مضاهاة الشكل (Faloutsos, et‏ 
al., 1994)‏ إلا أن الشكل مفهوم واضح المعالم بها فيه الكفاية» ومن السهل التعرف 
عليه في التحقق من الموضوعات الطبيعية الكامنة في الصور. ويكمن جزء من المشكلة 
بالنسبة لمضاهاة الشكل» في صعوبة التمييز آليا بين أشكال الصدارة foreground‏ 
وتفصيلات الخلفية background‏ في الصورة الطبيعية. وقد طورت dele‏ البحث في 
الاستفسار بمحتوى الصورة «Query By Image Content (QBIC)‏ على سبيل 
المثال» بعض طرق التصدي هذه المشكلة )1995 .Flickner, et al.,‏ 

Content-based image استرجاع الصور القائم على المحتوى‎ Lary 
على المستويات العليا أو الدلالية» على الرغم من عدم إمكان‎ uretrieval (CBIR) 
إجرائه على نحو مرض في الوقت الراهن- مطلبا من جانب المتعاملين. وتتوقف‎ 
الاختراقات في هذا المجال أيضا إلى حد بعيدء على التطورات التي تتحقق في بحوث‎ 
الذكاء الاصطناعيء أي أنها يمكن أن تتم عندما تتمكن الحاسبات فعلا من محاكاة‎ 
المهام الفكرية للعقول البشرية. ولا يزال استرجاع الصوره بناء على الخصائص‎ 
الدلالية أو الموضوعية» بحاجة لتدخل البشر» الأمر الذي يدل على عدم إمكانية‎ 
الاستغناء عن النهج القائم على الوصف في الوقت الراهن.‎ 


تكامل نهجي استرجاع الصور: 


يتعامل النهج القائم على المحتوى مع خصائص الصور التي يمكن تجهيزها 
آلياء إلا أنه لا يعمل OW‏ بفاعلية» إلا مع الخصائص الأولية للصورء OLS‏ 
والشكلء والملمس )1999 (Eakins & Graham,‏ ولا يمكن معالجة المستويات 
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:العليا لخصائص الصورء التي سبقت مناقشتهاء بنجاح لأغراض الاسترجاع؛ نظرا 
لأن الحاسبات لا تزال غير قادرة على إنجاز التحليل الذكي للصور. يضاف إلى ذلك 
أن نبج استرجاع الصور القائم على المحتوى» أحيانا ما يفشل على نحو مؤسف (Stix,‏ 
(2006. وفي مقابل ذلك» يمكن للنهج القائم على الوصف» معالجحة المستويات العليا 
أو الدلالية لخصائص الصورء بالتحقق من الصور» وما تتضمنه من موضوعات» 
ووصفها يدوياء من حيث ماهيتها وما تمثله. إلا أن مضاهاة الخاصية الأولية (كالشكل 
المعين لسقف مبنى tbe‏ على سبيل المثال) التي يمكن أن تتم بيسر في استرجاع الصور 
القائم على المحتوى» يمكن أن تكون مهمة غير عملية» في النهج القائم على الوصف. 
ولكل نبج سياقه الواضح» وله أيضا مظاهر قوته في استرجاع الصور )2001 (Chu,‏ 

وينمو البحث في استرجاع الصور ويتسع» وخصوصا في المجال القائم على 
المحتوى. ويبدو هذا النهج القائم على المحتوى» وهو أحدث النهجين» مستخدما في 
مشروعات البحث» على نحو أكثر كثافة واتساعا من النهج القائم على الوصف 
(Chu, 2001)‏ إلا أن النهج القائم على الوصف يظل هو الخيار الأول بالنسبة للنظم 
العاملة فعلا )1999 (Graham,‏ على سبيل المثال). 


وتزداد الحاجة إلى تكامل كلا النهجين وضوحا بمرور الوقت» وإلى أن يتم 
التوصل إلى وسائل للتجهيز SY‏ للمحتوى الدلالي للصور )1992 .(Cawkll,‏ وكان 
إيكنز وجراهام )1999( Eakins and Graham‏ اللذان يسميان النهج القائم على 
الوصف بطريقة الكلمات المفتاحيةء يعتقدان أن استعمال الكلات المفتاحية وخصائص 
الصور معاء يمكن أن يثبت جاذبيته. وقد سجلا عدة أسباب لاقتراحهم؛ أولما أن 
الكلمات المفتاحية يمكن أن تستعمل BUSY‏ المحتوى الدلالي للصورء بينما يمكن 
لمضاهاة الخواص الأولية أن يكمل ذلك على نحو عمليء بالتحقق من خواص الصور 
(اللون أو الملمس على سبيل المثال) التي يصعب تسميتها باتباع بج الوصف. ثانياء 
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من الممكن إحراز أرصدة نقاط مرتفعة للتحقيق والاستدعاء» عندما يتم» على سبيل 
ا لمثال» استعمال تشابه النص واللون معاء أرصدة أعلى نما يمكن إحرازه عند استعال 
أي منهما مستقلا. ثالثاء يمكن للاسترجاع بمجموعة من الطرق» باتباع بنى أو نظم 
معرفية مختلفة» أن يكون أكثر فاعلية Le‏ يمكن أن يتم بأي طريقة بمفردها 
.(Ingwersen, 1996)‏ ويسمى إنزر )2008( Enser‏ هذا ee‏ المتكامل 
بالاسترجاع الدلالي لمعلومات الصور. 

وقد حاول بعض الباحثين المنتمين إلى أوساط الاسترجاع القائم على المحتوى 
فعلاء دمج المعلومات النصية والدلالية مع الخصائص البصرية للصور» في بحوثهم؛ 
الأمر الذي يدل على بداية واعدة لتكامل النهجين )2001 (Chu,‏ كذلك نشرت في 
السنوات الأخيرة» تقارير تربط بين نجي البحث المختلفين (مثل Barnard, et al.,‏ 
Chang, et al., 19976‏ :2003). وفضلا عن ذلك أشار إيكنز وجراهام Eakins‏ 
Gand Graham (1999)‏ دراستهماء إلى أن الحواجز بين أوساط البحث المختلفة 
في المجال» تتهاوى تدريجيا. ومن الممكن لتكامل النهجين أن يحقق وصولا أفضل 
وأكثر كفاءة للصور الثابتة» وكذلك الأنواع الأخرى من المعلومات متعددة الوسائط. 


استرجاع الأصوات: 

تشمل الأصوات. التى تسمى أيضا بالسمعيات» الموسيقى غير اللفظية 
والحديث اللفظى» بالإضافة إلى الأصوات الطبيعية أو الاصطناعية الأخرى (كتغريد 
الطيور وضوضاء المرور على سبيل المثال). والموسيقى والحديث هما النوعان الرئيسان 
للمعلومات التي يتم استكشافها في استرجاع الأصوات. 

وقد أصبح استرجاع المعلومات الموسيقية Music IR (MIR)‏ تدريجياء مجالا 
متميزا للبحث؛ حيث نجد الآن ورش العملء واللجان» والمؤتهرات المكرسة خصوصًا 
للموضوع )2003 Downie,‏ وكذلك.اللغةء أحد المكونات الأساس لاسترجاع 
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المعلومات» فإن للموسيقى معنى مستتر. إلا أن الموسيقى ربا تكون أكثر تعقدا من 
اللغة؛ إذ أن أي أداء ها يضيف طبقة من التعقد )2002 (Lippincott,‏ وللموسيقى 
دلالتها الخاصة» ويمكن للحن أن ينقل معنى قد لا تكون الكلمات قادرة على التعبير 
عنه. وكا هو الخال بالنسبة للصورء يمكن للمقطوعة الموسيقية أن تفسر على نحو 
ختلف» من جانب ذوي الخلفيات المختلفة» وقي المواقف المختلفة. وفضلا عن 
السمات الموسيقية كالملحن» والأسلوب» والمؤدي» التي تستخدم في استرجاع 
المعلومات الموسيقية سيقية القائم على الوصف. للموسيقى خراص فريدة (كالنغمة spitch‏ 
والتناغم أو التوافق charmony‏ والجرس timbre‏ على سبيل: COLL‏ التي تستند إلى 
أي نوع من استرجاع المعلومات الموسيقية قية القائم على المحتوى» يتم تطبيقه. 
Abas E dips aly)‏ من لجس 
الاسترجاع؛ نظرا لطبيعة المعلومات الموسيقية نفسها ;2002 (Byrd & Crawford,‏ 
.Downie, 2003)‏ 


والحديث أو الخطاب speech‏ شكل للاتصال أكثر ثراء من النص التحريري 
أو المكتوب» من نواح عدة» نظرا للمكون الصوتي الإضافي. فمن الممكن على سبيل 
Jul‏ لجرس sound‏ الصوت voice‏ أن يساعد في تحديد هوية المتحدث (Oard,‏ 
(2000. وغالبا ما يسمى الحديث أو الخطاب. بالوثائق الناطقة spoken‏ فنشرات 
الأخبار» ومحادثات المؤترات» والمحادثات الحاتفية» من أمثلة الوثائق الناطقة. ونظرا 
لعدم إمكان انتزاع زيد skimmed‏ المعلرمات الصوتية أو مسحها أو تدقيقها 
scanned‏ أثناء عملية الاسترجاع» يتعين على الإنسان أن يستمع إليها من البداية إلى 
النهاية» عند محاولة العثور على مكان جزء بعينه. ويستغرق الاستاع إلى حديث أو 
خطاب ماء بوجه عام» وقتا أطول بكثير نما يستغرقه تدقيق النص أو مسحه. 
وا E aa a‏ امار جاع E‏ 
سترجاع النصوص. 
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استرجاع المعلومات الصوتية القائم على الوصف: 

لقد كان النهج القائم على الوصف. هو الطريقة الوحيدة لاسترجاع المعلومات 
الصوتية» قبل ظهور النهج القائم على المحتوى. فبإمكان الإنسان البحث عن 
الموسيقى باللحنء أو الأسلوبه أو الأدوات المستخدمة؛ وربم) أيضا بموظوع 
الموسيقى» على سبيل المثال )2005 (Lesk,‏ ومن الممكن استرجاع معلومات الحديث 
أو ا لخطاب» من بين نقاط وصول أخرى» بالمتحدث,. والمكان» والتاريخ» والوسائط 
التي سجل عليها الحديث» وموضوع الحديث. والمشكلات الرئيسة في اتباع النهج 
القائم على الوصف» لاسترجاع المعلومات الصوتية» هي الوقت والدقة. ونظرا "OV‏ 
المعلومات الصوتية غير قابلة للتصفح؛ فإن الأمر يستنفد الو قت إلى أقصى whe‏ 
لإعداد توصيفات حول المعلومات الصوتية لأغراض الاسترجاع. وإذا كانت سهات 
المعلومات الصوتية تنقسم إلى فئتين» هما الذاتية caboutness ¢ 5.2 sll, ofness‏ فإن 
موضوع المعلومات الصوتية» | هو ا حال بالنسبة GY‏ نوع آخر من المعلومات» من 
الصعب على الإنسان الحكم عليه أو الفصل فيه بدقة. ويبدو ذلك حقيقة واقعة على 
وجه الخصوصء بالنسبة للمعلومات الصوتية غير اللفظية» كالموسيقى التي قد لا 
تكون قد قصدت للتعبير اللفظي. 
استرجاع المعلومات الصوتية القائم على المحتوى: 

يستعار البحث حول استرجاع الموسيقى القائم على المحتوى» من ثلاثة 
مجالات؛ هي استرجاع المعلومات التقليدي» وعلم الموسيقى» وإدراك الموسيقى أو 
فهمها )2002 (Lippincott,‏ وتشمل السات المشتركة التي توضع في dol Fl‏ 
استرجاع المعلومات الموسيقية القائم على المحتوى» النغمة» والمدى الزمني» والتناغم» 
والجرس. وتدل النغمة على وجه التحديد» على مدى ارتفاع الصوت أو انخفاضه. 
وتتعلق المدة بمدى استمرار النوتة الموسيقية LÍ mote‏ التناغم فيعني نغمتين أو CAST‏ 
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تسمعان في الوقت نفسه» بينا يعني الجرس نوعية النوتة الموسيقية & (Byrd‏ 
Grawford, 2002; Downie, 2003)‏ ويتم تحليل هذه السات آليا لأجل التحقق 
من الموضوعات الموسيقية )2002 (Birmingham et al.,‏ أو الوحدات المتفرقة من 
المعلومات اللحنية )2000 (Downie,‏ التي تصبح Fone Page eras‏ لاسترجاع 
المعلومات الموسيقية سيقية القائم على المحتوى. فقد اقترح داوني )2000( Downie‏ على 
سبيل المثال» استرجاع المعلومات الموسيقية بفترات س-جرام n-gram‏ (أي المسافة 
ما بين النوتات الموسيقية) التي تشتمل عليها الألحان. وتشكل س-جرامات n-‏ 
grams‏ (راجع أيضا 0/ )١ /۲ /١‏ وحدات متفرقة من المعلومات اللحنية» على 
النحو نفسه إلى حد بعيد» الذي تشكل به الكلمات الوحدات المتفرقة للغة. ومن ناحية 
أخرى تبين لبرمنجهام وآخرين )2002( Birmingham et al.‏ أن ناذج 
ماركوف!" Markov models‏ المستترة» عملت بشكل جيد في نظام استرجاع 
الموسيقى ميوزآرت Musart‏ الذي قاموا بتطويره. والخوارزميات الخاصة باسترجاع 
المعلومات الموسيقية القائم على المحتوى» في الواقع أكثر عددا بكثير من الاثنتين اللتين 
ذكرتا توا. ويبدو أن هناك كثيرا من الخوارزميات الآلية لاسترجاع الموسيقى؛ بقدر ما 
هنالك من أعداد المتعاملين )2000 .(Downie,‏ 
وني نظام لاسترجاع المعلومات الموسيقية بناء على المحتوى» يتم تجهيز كل من 
معلومات مرصد البيانات والاستفسارات» باتباع خوارزمية معينة» لأغراض 
المضاهاة؛ فبإمكان المتعامل النهائي إدخال الاستفسار بالغناء أو الدندنة chumming‏ 
أو باستخدام UT‏ موسيقية ما )2006 Birmingham, Dannenberg & Pardo,‏ 
على سبيل المثال). إلا أن البحث حول استرجاع الموسيقى» في مقابل البحث حول 
استرجاع المعلومات النصية» نادر» حتى وإن كانت هناك مؤتمرات سنوية (مشل 


)*( العشوائية „Stochastic‏ (المترجم) 
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(International Symposium on Music Information Retrieval‏ 14.5 في 
السنوات الأخيرة» من أجل استرجاع الموسيقى على وجه الخصوص. ولا تزال النظم 
العاملة فعلا لاسترجاع المعلومات الموسيقية بناء على المحتوى نادرة الوجود. 

وني مقابل ذلك» يتضمن الإنتاج الفكري عدداً كبيرا جدا من البحوث حول 
استرجاع المعلومات الصوتية القائم على المحتوى (مثل & Goodrum,‏ 
|S (Rasmussen, 2000; Sparck Jones, et al., 1996‏ ا مسار لاستر جاع 
الوثائق الناطقة (مسار استرجاع الوثائق الناطقة (SDR track‏ في سلسلة مؤتمرات 
استرجاع النصوص ‘TREC‏ منترك -1 حتى ترك -4 & (Voorhess‏ 
.Garafolo, 2000)‏ والمخطوة الأولى في استرجاع الخطاب هي فصل القطاعات غير 
الصوتية عن القطاعات الصوتية. وتشمل القطاعات غير الصوتية أو المكابح الصوتية 
speech constraints‏ الوقائع غير الصوتية (كالتنفس المرتفع وطقطقة اللسان على 
سبيل (SUL‏ ومظاهر تعثر النطق أو عيوب النطق disfluencies‏ (كالكلمات غير 
مكتملة النطق»ء وحالات التوقف أو coo fl‏ والفأفأة أو التهتهة hesitations‏ على 
سبيل COL‏ والعناصر أو المكونات الوظيفية (مثل andy‏ وبالإضافة إلى in‏ 
«(addition‏ والموسيقى أو الضوضاء التي تغشى الصوت. وبعد إزالة هذه القطاعات 
غير الصوتية» يمكن إجراء المزيد من التحليل للقطاعات الصوتية تبعا لمختلف سمات 
الخطاب أو الحديث. | 

وتقسيم الحديث أو الخطاب أو تحليله إلى قطاعات» خطوة تثير التحديات» إلا 
أنه لا غنى عنها في استرجاع الخطاب. وبينما يمكن نسخ أو تحويل التدفق المستمر 
لمعلومات الحديث مباشرة» دون أي تحليل مسبق» فإن التحليل يكفل عدة مزاياء 
بالمقارنة با لحل المستقيم المباشر tstraightforward‏ إذ من الممكن أولا اقتطاف 
معلومات مهمة (كالفصل بين المتحدثين» والتحقق من هويات المتحدثين على سبيل 
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المثال) أثناء التحليل. ثانياء يمكن للتحليل للمسبق أن يؤدي إلى تجنب المشكلات 
الناشئة عن الانقطاع اللغوي أو الفجوة اللغوية عنذما يتغير المتحدث. ثالثا يحد 
'استبعاد القطاعات غير الصوتية» وتقسيم البيانات إلى قطاعات أقل طولاء من وقت 
إجراء العمليات الحاسبية على نحو ملحوظء كا يبسر فك الشفرات في مرحلة لاحقة 
.(Gauvain, Lamel & Adda, 2000)‏ 


وقد تم تطوير خوارزميات عدة» للتعرف على الحديث وفهم الحديث. 
والتعرف على من يتحدث مشكلة dake‏ قليلا عنن التعرف على ما يقال (Lesk,‏ 
(2005. ويتوقف الإلمام بالحديث على فهم الحديث» الذي يعتمد أكثر على معالجة 
اللغة الطبيعية (NLP)‏ وهو موضوع نناقشه في الفصل الثاني عشر. فالنغمة» 
والسرعةء والكثافة (أي التوقف بين الجمل أطول من التوقف بين الكلمات) من بين 
السات التي عادة ما تستخدم لاسترجاع الأصوات. وفضلا عن ذلك يستخدم نوع 
المتتحدث» وإحصاءات استعمال الكلمات» والكلمات المفتاحية التي تميز كل فئة» وذلك 
بالارتباط مع مفردات اللغة التي تنشأ على وجه التحديد من أجل الإلمام بالحدث 
وفهمه ;2000 (Kubala, et al., 2000; The SRI MAESTRO Team,‏ 
.Wactlar, et al., 2000)‏ كذلك تستخدم أساليب الاسترجاع التقليدية» كالوزن 
أيضا في استرجاع الحديث )1996 .(Spärck Jones, et al.,‏ إذ يتم تحويل الحديث 
آلياء بإنشاء النص المقابل الذي سيستخدم للمضاهاة أثناء عملية الاسترجاع. ومن 
الممكن تقديم الاستفسارات في شكل حديث» إذا ما توافرت تقنية للتعرف على 
الحديث لدى الطرف الخاص بالبحث. 

وكيا ذهب لسك )2005( Lesk‏ فإن هناك أربعة عوامل أو محددات تؤدي 
بقوة إلى صعوبة التعرف على الحديث: 
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gui اصع‎ paced gf fered poll ادف‎ gt dd bl patel. 


الحديث الذي يتم فيه التوقف بين الكلمات والجمل. 


. عدد المتحدثين: إذا كان الأمر يتطلب التعرف على جميع المتحدثين المشاركين في 


الحديث. فإن المهمة يمكن أن تكون أصعب مما هى عليه في حالة ما إذا كان 


. حتوی الحديث: يمكن لمحتوى الحديث أن يتراوح بين أي شيء بلا موضوع 


UE‏ وموضوع معين بمفردات لغوية محددة على نحو جيد» كا أنه من الأيسر 
بمكان إنجاز التعرف على الحديث في الحالة الأخيرة» مما يمكن أن يتم في 
الحالة الأولى. 


. بيئة الحديث: : هناك احتاللات كثيرة بالنسبة لبيئة الحدي يث؛ فمن الممكن من 


ناحية» للمتحدث أن يستعمل مكبرا جيدا للصوت في غرفة Bole‏ (كحديث 
المؤتمر على سبيل المثال»» وعلى الجانب الآخر يتحدث المتحدث في شارع 
صاخب» بدون مكبر صوت جيد (كالمقابلات في المواقع على سبيل المثال). 
والبيئة الأولى هي المثالية بالنسبة للتعرف على الحديث» بين الثانية ليست 
كذلك. 


وبالإضافة إلى هذه العوامل الأربعة» يمكن للهجة المتحدث أن تضيف إلى 


تعقد التعرف على الحديث أيضا. 


استرجاع الصور المتحركة: 


ا ا د i‏ 


والأصوات» الذي نوقش توا؛ فمن الممكن للصور المتحركة التي تتكون من الصور 
E‏ أن تكون مصحوبة بالصوت أو غير مصحوبة 
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on 


بالصوت. وأشرطة الفيديوء والأفلام السينائية» والبرامج التلفزيونية» من أمثلة 
الصور المتحركة المصحوبة بالصوتء ey‏ تمثل الرسوم المتحركة أو الأفلام الصامتة» 
الصور المتحركة بدون صوت. 

وقد اتبع النهج القائم على الوصف فى استرجاع الصور المتحركة. وتشمل 
التوصيفات الخاصة بالصور المتمركزة جوانب مثل المخرج السينائي» وسنة الإنتاج. 
تلك الجوانب التي عادة ما يتم اختيارها للتعبير عن الخواص الذاتية والموضوعات. 
إلا أن استرجاع الصور المتحركة باتباع هذا النهج» عرضة للمشكلات نفسها 
(كالتكلفة المرتفعة والكفاءة المنخفضة على سبيل المثال) التي غالباً ما تكتنف استرجاع 
الأنواع الأخرى من المعلومات متعددة الوسائط. 


وينطوي استرجاع الصور المتحركة» باتباع النهج القائم على المحتوى؛ 
بالضرورة» على ثلاث مهام رئيسة» وإن كان من الممكن إجراء الاسترجاع ببعض 
الأشكال المختلفة. والمهمة الأولى هي عزل المكون الصوتي» إذا كان هناك مكون 
صوتي» عن الصورة المتحركة؛ وتجهيز المعلومات الصوتية. والمهمة الثانية هي تقسيم 
الصور المتحركة إلى صور ثابتة وفقاً للقطات أو أي ole‏ أخرى. والمهمة الثالثة هي 
تجهيز الصور الثابتة. وبعبارة أخرىء فإنه من الممكن لاسترجاع الصور المتحركة» أن 
يختزل إلى استرجاع الصوت والصورة الثابتة. ويكمن مايميز استرجاع الصور 
المتحركة فعلاًء عن استرجاع الصوت والصور الثابتة» في تجزئة الصور المتحركة. 
ونظراً لأننا قد تناولنا استرجاع الأصوات واسترجاع الصور الثابتة في الأقسام 
السابقة؛ فسوف تركز هذه المناقشة على تجزئة الصور المتحركة لأغراض الاسترجاع. 

فالصور المتحركة ينبغي أن تجزأ أو تفكك» لكي تصبح قابلة للاسترجاع. 
وعادة ما تتخذ المناظر أو الوقائع وحدات دلالية» من أجل تجزئة الصور المتحركة. 
ويتم التحقق منها باكتشاف التغير في هذه العوامل» كتوزيع اللون» والملمسء والحزوز 
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cuts‏ والظلال fades‏ والتلاشي› وومضات الكاميراء آليا. ويتكون المنظر بدوره من 
عدة لقطات» يمكن تحليلها أيضاً إلى عدة أطر لكل لقطة. ومن ثم فإن التقسيم يمكن 
أن يتم وفقاً للمنظرء أو اللقطةء أو.الإطار. 

ويعرف تجزىء الصور المتحركة باللقطة» باكتشاف أطر اللقطات 
shot boundary frames detection (SBD)‏ وتقوم معظم last ILA‏ 
'حدود اللقطة بحساب التشابه بين الأطر المتجاورة؛ وتمييز flag‏ التغير المحتمل Akal‏ 
عندما ينخفض ذلك التشابه إلى ما دون حد معين )2004 (Smeaton,‏ وتعمل هذه 
الأساليب بشكل مناسب إلى حد معقول» إذا كان بالصور المتحركة حدود لقطات 
واضحة. بحيث يرد الإطار الأول للقطة الجديدة بعد الإطار الأخير من اللقطة 
السابقة مباشرة. إلا أن Les‏ من الصور المتحركة تنطوي على تحول تدريجى من لقطة 
idl‏ ى (كحالات التلاشي الداخلي وحالات التلاشي الخارجي» وحالات الذوبان» 
والمظاهر الخارجية amorphs‏ والرتوش أو اللمسات wipes‏ على سبيل المثال» لجعلها 
أكثر متعة من الناحية الجالية. lel‏ مثل هذه المؤثرات التجميلية في الصور المتحركة» 
التي تتحدى سهولة SLES‏ دوه الاعات ونتايل ذلك قبل يحض أساليت 
اكتشاف حدود اللقطات (كاكتشاف الحواف على سبيل المثال) OY‏ تتعامل مع 
التحولات التدريجية بشكل مناسب» إلا أنها من المرجح أن تسفر عن صور موجبة 
خادعة في اللقطات الخافتة أو البعيدة عن التركيز )2004 .(Smeaton,‏ 

وكا سبق أن لاحظناء فإن اللقطة تتكون من أطر مجمعة معاء بناء على بععض 
السات المشتركة. ويسمى الإطار الذي يمثل كل لقطة الإطار الرئيس „keyframe‏ 
ويعني اختيار إطار رئيس» العثور على الإطار الذي يمثل المجموعة المتوسطة» من 
الأطر في اللقطة على خير وجه. ويمكن للإطار الرئيس أن يكون في بداية اللقطة» أو 
فى نهايتهاء أو في أي موضع متوسطه إلا أنه لم يتم حتى OW‏ إجراء دراسات لتحديد 
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أي أساليب اختيار الإطار الرئيس أكثر نجاحاً في التطبيق )2004 (Smeaton,‏ غير 
أنه غالباً ما ينظر إلى اختيار الإطار الرئيس بوصفه ”مهمة مغلقة "black art‏ 
وتنطوي أكثر الطرق شيوعاً على اختيار الإطار الرئيس من منتصف اللقطة. 
ومن الممكن بعد ذلك» وضع مجموعة من الأطر الرئيسة معاً لتشكل القصة 
المصورة storyboard‏ للصور الثابتة الموضحة أو الشارحة»ء لتمثيل كل مشهد. وعلى 
الرغم من أن التجميع الآلي للقطات في مشاهد منطقية» عن طريق الأطر الرئيسة 
يحظى OV!‏ بقدر كبير من الاهتمام» فقد أثبتت الجهود من هذا النوع صعوبتهاء إلا في ` 
المجالات المنضبطة تنظيمياً للصور المتحركة (كنشرات الأخبار التلفزيونية» التي عادة 
ما تنطوي على الأفراد العاملين de SLs‏ والأرصدة التمهيدية» وسلسلة القصص 
المتفرقة). وبالإضافة إلى طريقة الإطار الرئيس» يستخدم أسلوب انتزاع زيد 
skimming‏ الفيديو لإنتاج سلسلة من مقاطع الفيديو القصيرة» التي يتضمن كل منها 
التفصيلات الأساسية لتتابع واحد» أو سلسلة من اللقطات ذات الدلالة اللغوية 
(Eakins & Graham, 1999)‏ وتشكل تلك الكيانات» الأساس بالنسبة 
. لاسترجاع الصور المتحركة. وعادة ما يوفر تتابع الصور المتحركة معلومات أكثر Le‏ 
توفرها الأطر الرئيسة» لأغراض الاسترجاع. ومن الممكن للصور المتحركة نفسهاء أن 
تكون بمثابة استفساراتء إذا ما كانت مقاطع الفيديو القصيرة مقتطفة» ومتاحة في 
نظام استرجاع المعلومات. فالاستفسار بالمثال المتحرك من الحالات الجديرة بالاهتام 
.(Chang et al., 1997a)‏ 
وهناك نبج آخر ربا يكون الأبسط والأكثر شيوعاء وهو مضاهاة نص 
استفسار المستفيد» مقابل تسجيل خطي من المحتوى الناطق المقتطف من الصورة 
المتحركة. وفي استرجاع الوثائق الناطقةء يمكن هذا الأسلوب أن يظل فعالاً إلى حد 
بعید» حتى وإن كان معدل الخطأ في OSI‏ في حدود (Sparck Jones et 41, 6٠‏ 
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al, 1996)‏ ومن بين مضامين نتيجة عملية البحث هذه» أن يبدو استرجاع الصور 
المتحركة بناء على الحديث الذي يتم التعرف عليه واعداً. وأفضل مثال لنظام استرجاع 
الفيديو الذي يدعم البحث بالنسخة الخطية» أو البحث عن طريق العبارات الجاذبة 
المغلقة» هو علامة الطريق» التي تطورت في مشروع مكتبة الفيديو الرقمي إنفورميديا 
(Informedia Digital Video Library (www.informedia.cs.cmu.edu‏ 
بجامعة كاري ينجي ,5 & Carnegie Millon University (Hauptmanm‏ 
.Witbrock, 1997)‏ وأحياناً ما يكون من الممكن استعمال المعلومات الصوتية التي 
تتضمنها الصور US pall‏ للتخلص من الغموض في تجزىء وتفسير الصور المتحركة. 
والعكس صحيح .(Wactlar, et al., 2000) Lal‏ 

وربما يتبين لنا من هذه المعالجة الموجزة أن التجزىء الآلي للصور المتحركة» 
ليس بالمهمة اليسيرة؛ فالتجزىء عملية معقدة متعددة | orl glad‏ فالفيديو على سبيل 
SLAM‏ يمكن أن يتكون أولاً من القصةء ثم من الأحداث» واللقطة والإطار 
Boykin & Merlino, 2000; Smeaton, 2004)‏ وبينا يبدو التجزىء باللقطة 
والإطار d the‏ فإن التجزىء بالقصة والأحداث يتطلب جهوداً بشريةء أو ذكاء 
اصطناعياً. وهذا مبرر آخر لضرورة الجمع بين النهج القائم على المحتوى والنهج 
القائم على الوصف. في استرجاع الوسائط المتعددة» في ظل الوضع الراهن لتقنيات 
الاسترجاع )2008 (Wan & Liu,‏ 


استرجاع الوسائط المتعددة على الإنترنت: 


اشتهرت عنكبوتية الإنترنت بقدرتها على تداول المعلومات متعددة الوسائط. 
ومن ثم فإن عدداً كبيراً من نظم استرجاع الإنترنت (جوجل على سبيل المثال) يدعم 
البحث في الوسائط المتعددة» سواء كانت هذه النظم وحدهاء أو بالتعاون مع 


362 


الشر كات المتخصصة في إدارة cole glee‏ الوسائط المتعددة» على نحو يكفل للمستفيد 
النهائي الوصول إلى ثروة الوسائط المتعددة على العنكبوتية: 

وهناك ثلاث طرق مختلفة قائمة على الوصف. في متناول المستفيدين النهائيين» 
تسترجع معلومات الوسائط المتعددة من العنكبوتية: 

.١‏ بالكلمات المفتاحية: إذ يستطيع المستفيدون استرجاع معلومات الوسائط المتعددة 
بالكلات المفتاحية» LE‏ كا يفعلون في بحث المعلومات النصية. وتعمل هذه 
الطريقة بكفاءة على وجه الخصوص: في المواقع المخصصة لعمليات البحث عن 
الصورء مثل بكسيرش .(www.picseareh.com) Picsearch‏ 

؟. بنوع الوسائط المتعددة: فالوسائط المتعددة اسم جامع لمختلف أنواع 
المعلومات غير النصية» كالصورء وتسجيلات إم بي ثري MP3‏ والفيديو. 
ويمكن لأنواع الوسائط المتعددة هذه» أن تكون بمثابة نقاط وصول في عملية 
الاسترجاع. وتستخدم بعض نظم استرجاع الإنترنت (مشل ألتافيستا 
(Altavista‏ أزرار المذياع» أو تقنية أخرى ماثلةء ليختار بها المستفيديون النوع 
الذي يودون استرجاعه من الوسائط المتعددة. 

۳. بامتداد اسم الملف: فعادة ما تكون لأساء الملفات في البيئة الرقمية» ما يصل 
إلى ثلاثة أحرف في امتداد ملفهاء لتحديد نوع الملف. وني حالة ملفات 
الوسائط gif op casali‏ و8مل» على سبيل JEU‏ امتدادات عادية للملفات» 
بالنسبة للصور الثابتة. وعادة ما تنتهي أساء الملفات» الناطقة ب cau‏ أو 08035 
أو 5223. أو ما شابه ذلك» وتشمل امتدادات أساء الملفات بالنسبة للصور 


المتحركة mpg‏ و122078. ومن الممكن تضمين امتدادات أسماء الملفات هذه في 
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الاستفسارات» وذلك لاسترجاع نوع معلومات الوسائط المتعددة المحدد 
(مثل greatwall.gif‏ كاستفسار للبحث). 


والنهج القائم على المحتوى متاح أيضاً على الإنترنت» لاسترجاع معلومات 
الوسائط المتعددة. وتدعم بعض نظم استرجاع الإنترنت» كلا النهجين؛ فبإمكان 
المتعاملين» على سبيل المثال؛ بدء عملية بحث ما بنهج الكلمات المفتاحية القائم على 
الوصف. ثم E‏ البحث بالسمات القائمة على المحتوى» كاللون والشكل على 
سبيل المثال. ويكفل بحث الصور في Bing.com‏ للمتعاملين» الحصول على المزيد من 
الصور الماثلة للصورة المسترجعة. باستعمال الكلمات المفتاحية» وذلك بالنقر ببساطة 
على رابطة ”المزيد من الصور الماثلة (Schwartz, “more similar images‏ 
(2008. والنظم الأخرى مصممة للتعامل فقط مع استرجاع معلومات الوسائط 
المتعددة, القائم على المحتوى. إلا أن النظم من هذا النوع (مثل Convera's Visual‏ 
(Retrievalware‏ تتاح للمتعاملين مع الإنترنت» عندما تكون النظم في مرحلة 
الاختبار التجريبي beta test‏ فقط . وبمجرد انتهاء الاختبار» تصبح هذه النظم تعمل 
بمقابل رسوم. ولا تتاح في النطاق العام. ويمكن لنظم أخرى أن تتوقف عن العمل 
نظراً للافتقار إلى الترويج أو الإدارة المناسبة. 

واسترجاع معلومات الوسائط المتعددة على الإنترنت» في سبيله OY‏ يصبح 
أيسر مما كان عليه من قبل. ويرجع الفضل في ذلك إلى التطورات التقنية» وجهود 
الباحثين. إلا أن استرجاع الوسائط المتعددة بوجه cele‏ لا يزال أمامه شوط طويل» 
حتى Git‏ الأداء المرضي. وقد لخص لسك )2005( Lesk‏ يوما ما الوضع الراهن 
للمعرفة في استرجاع الوسائط المتعددة على النحو التالي: 
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بإمكاننا تصنيف الصور pictures‏ على وجه التقريب إلى 
حد بعيد» وفقاً للون والملمس والشكل» ولا يكفي ذلك للتعامل 
مع مجموعات ملايين الصور الضوئية. وبإمكاننا تحقيق التعرف 
على الصوت» بطريقة تكفي تماما OY‏ يكون هذا التعرف مفيدا إلى 
حد ماء في تحليل التسجيلات الصوتيةء ولدينا تقنيات محددة 
لبحث الموسيقى. ولدينا حيل متعددة لضغط الفيديو وتصفحه. 
إلا أنه ليس لدينا سوى تقنيات محدودة Coed‏ فيه (0.115). 


معلومات النصوص الفائقة والوسائط الفائقة: 

يعني صدر الكلمة أو البادئة hyper‏ في hypertext‏ ”الامتداد إلى أبعاد أخرى 
أو تعدد الأبعاد“ )1997 (Cornejio,‏ وبذلك المعنى يتكون النص الفائق 
hypertext‏ من bla‏ ارتكازية modes‏ من المعلومات» وروابط clgry‏ في فضاء متعدد 
الأبعاد. والوسائط الفائقة hypermedia‏ كذلك أيضاًء من حيث المفهوم والبناء إلا 
أن الوسائط المتعددة لا تشمل النصوص فحسب» ily‏ تشمل أيضاً معلومات 
الصوت والصورة. 

بيد أن كلا من النصوص الفائقة والوسائط الفائقة؛ تختلف عن النصوص 
والوسائط المتعددة من النواحي التالية؛ فالنصوص الفائقة والوسائط الفائقة» تتخذ 
أولا شكل الشبكة:؛ لا التكوين الخطي المسطح للنص والوسائط المتعددة. Lat‏ هناك 
الروابط التى تربط بين النصوص الفائقة والوسائط الفائقة مادياء بين) الروابط بين 
الوثائق غير فائقة البنيان nonhyperstructured‏ مجرد Lily‏ مفاهيمية. LG‏ يتم 
وضع الروابط بين الوثائق فائقة البنيان hyperstructured‏ من أجل المستفيد» بين| 
يتعين على المستفيد أن يعد الروابط بين الوثائق غير فائقة البنيان» حسبا تقتضي 
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الضرورة. وتفضي الخواص الفريدة للنصوص الفائقة والوسائط الفائقة؛ إلى طرق 
جديدة لاسترجاع المعلومات» في البنية فائقة ئقة التنظيم. 

ويمكن للتصفح» لا البحث أن يكون النهج الرئيس» الذي يتبعه المتعاملون في 
a‏ النصوص الفائقة والوسائط الفائقة؛ نظراً لأنه کا بينا في 1/ ۲/ ۲» فإن البيئة 

as‏ البنيان تشجع أنشطة التصفح. وتتوافر نقاط الوصول أو مصطلحات الاستفسار 

كأسماء nae‏ فائقة» في عملية الاسترجاع code‏ بحيث تستبعد حاجة المتعامل OY‏ 
يختارها بنفسه. وقد يبدو اختيار مصطلحات البحث سهلاً بالنسبة لاختصاصي 
المعلومات المتمرس. إلا أنه Lal‏ للست الهاي مهم PEE EE TE‏ 
' وتنطوي على تحليل للمفاهيم» والنظر في أوجه الاختلاف بين ال صطلحات. يضاف 
إلى ذلك قدرة المستفيد على التحرك تلقائياً في فضاء استرجاع المعلومات متعدد الأبعاد 
هذاء بمجرد النقر على الروابط الفائقة» التي تربط بين مختلف النقاط الارتكازية 
للمعلومات. وعندما يقع الاختيار على البحث» كنهج للاسترجاع» OP‏ أسماء الروابط 
ae ee‏ و ل ل ل 
تقنية الترتيب الطبقي. فكثير من نظم استرجاع الإنترنت» على سبيل المشال» تضع 
ES KGS‏ ل 
يضاهي اسم رابطة تتضمنه الوثيقة. 

ومن ناحية أخرى» يكتنف استرجاع النصوص الفائقة والوسائط الفائقة» 
بالتصفح مشكلات محتملة» نظراً للبنيان الفائ ثق. فمن الممكن أولأء للمتعاملين أن 
يضلوا طريقهم في الفضاء sll‏ 3« عند التصفح باتباع الروابط الفائقة ئقة ببساطة. Lov‏ 
يمكن للمتعاملين أن يجدوا من الصعب إلقاء نظرة عامة على المعلومات التي يبحثون 
عنها؛ نظراً OF‏ انتباههم يمكن أن ينصرف بسهولة» نحو كثير جداً من الوثائق 
الأخرى المرتبطة. IE‏ يمكن للمتعاملين أن يجدوا صعوبة في العثور على معلومات 
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معينة» حتى وإن كانوا يعرفون أن هذه المعلومات موجودة فعلا في النظام. ويمكن 
لخرائط المواقع التي تنشأ في بعض مواقع العنكبوتية» أن تساعد في هذا الصدد. إلا أن 
هذه الخرائط لا تتوافر في جميع نظم استرجاع المعلومات فائقة البنيان» وإذا ما توافرت» 
فإنها قد لا تكون مفصلة |S‏ ينبغي. 

ويبسر إدخال نهج البحث في البيئة فائقة البنيان» استرجاع النصوص الفائقة 
والوسائط الفائقة. ويبدو نهج البحث. في الواقع» قادراً على التغلب على المشكلات 
. الثلاث التي تكتنف التصفح» كنهج لاسترجاع النصوص الفائقة والوسائط الفائقة. 
eas‏ تشجع الوثائق فائقة البنيان على التصفح» فإن البحث يمكن أن يتغلب على أي 
مشكلات استرجاع» ترتبط بالتصفح في الفضاء الفائق. ومن ثم يبدو التكامل بين 
نجي البحث والتصفح» أفضل سبيل لاسترجاع النصوص الفائقة والوسائط الفائقة. 
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الفصل العاشر 
المستفيد طرفا في تنظيم المعلومات واسترجاعها 


المستفيد عامل حاسم» ينبغي وضعه في الحسبان» في جميع أنشطة وجهود تنظيم 
المعلومات واسترجاعها؛ نظراً OV‏ الهدف النهائي لتنظيم المعلومات واسترجاعها هو 
تلبية احتياجات المستفيد من ا معلومات» فالمعلومات» يتم تنظيمها على سبيل JLM‏ 
بحيث يستطيع المستفيدون استرجاعها عند الحاجة إليها. وقد تم تطوير مختلف طرق 
الاسترجاع وأساليبه» بحيث يستطيع المستفيدون اختيار الملائم منهاء بناء على 
احتياجاتهم المحددة من المعلومات. 


وبعد المستفيد, أو ما يتصل بالمستفيد» في تنظيم المعلومات واسترجاعهاء حيوي أيا 
كان ا منظور الذي يمكن للمرء اتخاذه؛ فمن وجهة نظر مصمم النظام» على سبيل مخال» 
فإنه من أجل تلبية الاحتياجات المعلوماتية للمستفيدين؛ يتم بناء نظم تهيشة المعلومات 
واسترجاعها. وعلى الرغم من أن المتعاملين في تنظيم المعلومات اختصاصيو معلومات 
على الأرجح» يختلفون عن المستفيدين النهائيين في استرجاع المعلومات فإنهم يتقاسمون 
معهم كثيرا من أوجه التشابه كمستفيدين في أنشطة تنظيم المعلومات واسترجاعها. 
ويعالج هذا الفصل المستفيدين واحتياجاتهم المعلوماتية» ثم يستكشف بعد ذلك النهج 
Gall‏ الموجه نحو المستفيد» في تنظيم المعلومات واسترجاعها. وأخيرا نناقش التفاعل بين 
المستفيد ونظام استرجاع المعلومات» إلى جانب بعض القضايا المرتبطة بذلك: 
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المستفيدون واحتياجاتهم المعلوماتية: 

المستفيدون أفراد» لكل منهم خصائصه المميزة. إلا أنه لا يمكن ولاشك دراسة 
كل مستفيد بمفرده» لأغراض تنظيم المعلومات واسترجاعها؛ فالواقع أن الباحثين 
يقسمون المستفيدين إلى فئات» بتطبيق معايير مشتركة» كالنوع» والسن» والمهنة» 
والظروف الاقتصادية» والثقافة» والشخصية, والخلفية التعليمية. وبناء على هذه 
الخصائص العامة يمكننا التعرف على احتياجات مختلف الفئات على نحو أفضل» حتى 
وإن كنا ندرك أن ااك المستفيد تتأثر بكثير من العوامل الأخرى أيضا (كمصاذر 
المعلومات على سبيل المثال). 

وإذا نظرنا إلى السن كمثال» فإن المستفيدين مختلفي الأعمار لحم احتياجاتهم 
المعلوماتية المختلفة. فالمستفيدون في سن المدرسة» أو في ظروف العمل» بوجه عام» 
dole‏ ما تكون لدم احتياجاتهم المعلوماتية بالنسبة للتعليم» أو المتصلة بالعملء بين| 
تميل الفئات العمرية الأخرى للحاجة إلى المعلومات العامة في معظم الأحيان. والمهنة 
معيار آخر للتحقق من احتياجات المستفيد؛ فالمشتغلون بالعلم على سبيل المشال» 
يشكلون dole‏ ما يسمى الجامعات الافتراضية invisible colleges‏ لتبادل المعلومات 
(راجع 1963 Crane, 1972; Price,‏ على سبيل المثال) بين| يعتمد المهندسون. في 
مختبرات البحث والتطوير» على السدنة gatekeepers‏ للتواصل مع العالم الخارجي 
(راجع 1970 Allen,‏ على سبيل المثال). وقد استقصى شودري Chowdhury‏ 
)1999( الاحتياجات المعلوماتية للمستفيدين» في مجالات أنشطة مختلفة (كإدارة 
الأعمال والمشروعات على سبيل المثال). وقد تم تلخيص المزيد من الدراسات حول 
سلوك المستفيدين في التياس المعلومات «information seeking behavior‏ وهذا 
مصطلح أحدثء تبناه الباحثون في المجال ليحل محل التعبير الأقدم وهو الاحتياجات 
المعلوماتية وأوجه الإفادة» وذلك من جانب كيس )2007 ,2006( Case‏ في دراسته 
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الوصفية التحليلية الضافية لمن يلتمسون المعلومات (أي المستفيدون)ء وفقا للمهنة 
(كالمشتغلون بالعلم أو المهندسون على سبيل COLA‏ والدور(كالمرضى والطلبة 
على سبيل المخال)ء والجوانب الديموجرافية (كالسن والفغة الإثنية أو العرقية 
عل سيل (SEU‏ 

ولقد أعاد العصر الرقمي» ونمو الإنترنت على وجه الخصوص» النظر في 
تعريف المستفيدين واحتياجاتهم المعلوماتية» في عملية تنظيم المعلومات واسترجاعها 
فعلا. وهناك تزايد في جهود استكشاف خبرات البحث «search histories‏ 
وأفضليات البحث (كنوع الملف» واللغة» ومجال AKAN‏ والدولة)» وسياقات البحث 
الأخرى» وذلك في البحوث المتصلة» كاسترجاع المعلومات على الإنترنت (راجع على 
سبيل .(Komlodi, Soergel & Marchionini, 2006; Rose, 2006 JL‏ و E‏ 
الوقت نفسه» ينبغي أن يظل المستفيد متحكى| في حدود السياق الذي يتضمنه استفسار 
البحث» لكل من دواعي الخصوصية؛ ولأن الخوارزميات الراهنةء قد لا تفسر السياق 
على نحو سليم في بعض الأحيان )2006 (Resnick & Vaughan,‏ ولما كان العصر 
الرقمي قد حل فعلا بكل SE‏ وأنه قد وجد ليبقى؛ فإن احتمالات تأثير ذلك في 
أجيال المستقبل» في سبيله لأن يصبح موضوعا للبحث. وقد درس رولاندز وآخرون 
(Rowlands et al. (2008)‏ على سبيل ell‏ تأثير التحول الرقمي على السلوك 
المعلوماتي» ليل جوجل (أي أولئك الذين ولدوا بعد عام VAAN‏ وتدعي الدراسة 
أنه على الرغم من أن الشباب يبدون سهولة واضحة» وتآلفا مع الحاسبات» فإنهم 
يعتمدون بكثافة على محركات البحث» ويشاهدون أكثر Le‏ يق رأون» ويفتقرون إلى 
المهارات النقدية والتحليلية اللازمة لتقييم ما يجدون من معلومات على العنكبوتية. 

وييسر الإلمام بالمستفيدين واحتياجاتهم» أنشطة تنظيم المعلومات واسترجاعها. 
وقد أجريت أعداد ضخمة من الدراسات» لاستكشاف SU‏ سات المستفيدين على 
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تنظيم المعلومات واسترجاعها في العصر الرقمي Borgman, 1989; Buente Jia)‏ 
Robin, 2008; Fenichel, 1981; Marchionini, et al. 1993; Zhang &‏ & 
Chignell, 2001‏ بالنسبة لمن يقومون el ab‏ عمليات البحث. و Faroog, et al.,‏ 
JL 2007; Kipp & Campbell, 2006‏ .4 للمكشفين). ولقد ازدادت درايتنا 
بالمستفيد في إطار تنظيم المعلومات واسترجاعهاء ولاشك بفضل البحوث 
من هذا النوع. 

إلا أن الحاجة إلى المعلومات مفهوم غامض؛ إذ يفتقر إلى البنيان المنضبط» فضلا 
عن افتقاده للدقة وغياب التنظيم؛ وهذا السبب أسهاه بلكن وزملاؤه آسك ASK‏ أي 
الحالة المعرفية غير السوية (Belkin, Oddy anomalous state of knowledge‏ 
(Brooks, 1982‏ )&. وفضلا عن ذلك فإن للاحتياجات المعلوماتية خصائص 
أخرى» تشمل التغير بمرور الوقت» والاختلاف من مستفيد إلى آخر» والتوقف على 
البيئة. يضاف إلى ذلك أن الاحتياجات المعلوماتيةء غالبا ما تظل دون إعراب عنهاء أو 
يكون الإعراب Lge‏ بشكل غير مناسب )1999 (Chowdhury,‏ والواقع أن 
المستفيدين غالبا ما يجدون صعوبة في التعبير عن احتياجاتهم المعلوماتية كاملة 
وناهيك عن التعبير عنها بدقة. وليس من غير المألوف أن تصدر العبارات التالية عن 
المستفيدين» عندما يُسألون be‏ يبحثون عنه: ”سشوف أعرف عندما أراها“. وغالبا ما 
يجري اختصاصيو المعلومات مقابلات مرجعية» وهي إحدى خطوات البحث الذي 
يحظى بالمساعدة» للعمل على حل هذه المشكلة. 

وفضلا عن خصائص المستفيد» تحقق بيزلي )1968( Paisley‏ من أربعة عوامل 
أخرى تؤثر في الاحتياجات المعلوماتية للمستفيدين: 


التأثير على احتياجاتهم. وتختلف توقعات المستفيدين عندما تتوافر هم على 
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سبيل المثال» معلومات من نظام محلي» في مقابل ما يتوافر لحم من نظام 
وطني في تغطيته. 
؟. الهدف: لأي هدف يحتاج المستفيدون إلى المعلومات؟ فإذا كان المستفيدون 
يرغبون في المعلومات لمجرد الإجابة عن بعض الأسئلة ا حقائقية (ما أعلى 
مبنى في العالم؟ على سبيل المثال)» فإن احتياجاتهم المعلوماتية تبدو بسيطة 
أو مباشرة. أما إذا كان المستفيدون يريدون المعلومات من أجل مشروع 
بحث ماء فإن احتياجاتهم المعلوماتية تدخل ولاشك في فئة أخرى. 
۳. العوامل الخارجية: يمكن للعوامل الاجتاعيةء والسياسية» والاقتصادية» 
وغيرها من fal gall‏ الخارجية؛ أن تؤثر بقوة في المستفيدين واحتياجاتهم 
المعلوماتية. 
.٤‏ النتيجة: ما الحصيلة التي تعود على المستفيدين» نتيجة للإفادة من 
المعلومات؟ فمن الممكن للنتائج الإيجابية» على سبيل المثال (زيادة 
الإنتاجية (des‏ أن تكون بمثابة مكافآت للمستفيدين» كما تحثهم على 
المزيد في ذلك الصدد. 
وقصارى القول» فإن المستفيدين أنفسهم» إلى جانب مصادر المعلومات» 
وال هدف, والعوامل الخارجية» والنتيجة» يشكلون العوامل الخمسة التي تؤثر في 
الاحتياجات المعلوماتية. وعلى الرغم من أن بحث بيزلي Paisley‏ حول الاحتياجات 
المعلوماتية» نشر عام VATA‏ فإنه لا يزال صا اليوم» ونحن بصدد مناقشة الموضوع 
في سياق تنظيم المعلومات واسترجاعها رقميا. 

Uy‏ كانت الاحتياجات المعلوماتية تتأثر بكثير جدا من العوامل» فإنه من 
المتوقع أن تكون هناك أنواع مختلفة من هذه الاحتياجات. ومن التصنيفات المألوفة» 
تقسيم الاحتياجات ال معلوماتية إلى فئتين؛ LAY gl‏ ا لحاجة إلى عنصر معروف» والثانية 
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الاحتياجات الموضوعية )1993 (Lancaster & Warner,‏ وذلك بمجموعة 
Sl‏ من المصطلحات؟؛ كالاحتياجات المعلوماتية المحددة واضحة امعان «concrete‏ 
ob Lo Vy‏ المعلوماتية المرتبطة بمشكلة ما )1988 yy -Frants & Brush,‏ 
الحاجة إلى عنصر معروف» والاحتياجات المعلوماتية المحددة» عن مفهومين 
متشابمين» كا يصدق الأمر نفسه بالنسبة للاحتياجات الموضوعية» والاحتياجات 
المعلوماتية المرتبطة بمشكلة ما. فالفئة الأولى حددة واضحة المعام» بين| الثانية ليست 
كذلك. وتتطلب تلبية.الاحتياجات الموضوعية أو الاحتياجات المعلوماتية المرتبطة 
بمشكلة ماءبوجه عام» قدرا كبيرا من الجهد. ونادرا ما تطبق المعايير الأخرى (كفورية 
المعلومات على سبيل (JE‏ لتصنيف الاحتياجات المعلوماتية؛ فالمستفيدون في العلوم 
البحت chard sciences‏ على سبيل المخال» dole‏ ما يحتاجون إلى المعلومات الحديثة» 
le‏ يمكن للمستفيدين في العلوم المشة soft‏ أن يكونوا أكثر اهتماما بالمعلومات 
الراجعة الشاملة. 

وكما سبق أن بيناء فإن أنشطة تنظيم المعلومات واسترجاعهاء ينبغي أن تمليها في 
امقام الأول الاحتياجات المعلوماتية للمستفيدين. ونظرا لأن المستفيد هو من يشعر 
بالحاجة إلى المعلومات» فإن بعد المستفيد» أو ما يتصل بالمستفيد في تنظيم المعلومات 
واسترجاعهاء pal‏ واضح لا لبس فيه. وهذا السبب يحاول الباحثون اتباع نهج يركز 
على المستفيد» لرسم مسار التطور في استرجاع المعلومات. 


الأنموذج المعرفي والنماذج التي تركز على المستفيد: 

عندما يكون التركيز في تنظيم المعلومات واسترجاعهاء منصبا على المستفيدء 
يستعير الباحثون الذين يطورون الناذج والطرق الجديدة» نظريات ومناهج مستعارة 
من المجالات التخصصية dhe cll‏ بالبشر» كعلم النفس» وعلم الاجتاع» 
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والأنئروبولوجيا أو علم الإنسان. فالأنموذج المعرفي لاسترجاع المعلومات» على 
سبيل المثال» إطار يستمد مقوماته بكثافة» من علم النفس المعرفي» بينم يستند تنظيم 
المعلومات واسترجاعهاء في السياق» إلى أسس علم plea‏ والأنثروبولوجياء 
والاتصال )2004 (Rogers,‏ وتتناول الأقسام التالية الأنمو ذج المعرفي والناذج 
الأخرى التي تركز على المستفيد في المجال. 
الأنموذج المعرفي: 

الإدراك cognition‏ هو الملكة أو العملية الفكرية التي يتم بها الحصول على 
المعرفة knowledge‏ أو اكتسابهاء وذلك عن طريق الملاحظة:؛ والتفكير. والحدس 
(Soukhanov et al., 1984)‏ ويركز الأنموذج المعرفي» الذي يختلف عن الناذج 
الأخرى لاسترجاع المعلومات» على الأنشطة المعرفية للمستفيدين» أثناء عملية 
استرجاع المعلومات. كيف تتشكل» على سبيل المثالء الاحتياجات المعلوماتية 
للمستفيد؟ كيف يحكم المستفيد على صلاحية النتائج المسترجعة؟ وهذه الأسئلة صعبة 
ولاشك» ويعمل الباحثون على الإجابة عنها على مر السنين. 

وتركز نماذج استرجاع المعلومات» التي تناولناها في الفصول السابقة» على 
المعلومات وجوانب نظام استرجاع المعلومات. فكيف يمكن» على سبيل JU‏ 
التعبير عن المعلومات أو الاستفسارات؟ أي أساليب استرجاع المعلومات» ينبغي أن 
يحظى بالدعم؟ أي أساليب استرجاع المعلومات تعمل أفضل من غيرها؟ إلا أن هذه 
النهاذج لا تزال محدودة على نحو ملحوظ؛ إذ إا لا تولي السياقات الاجتاعية 
والمعرفية التي تتم فيها مهام التنظيم والاسترجاع. ela Yl‏ الكافي (Ingwersen,‏ 
(1996. وبناء على أنموذج إنجورسن )1996( Ingwersen‏ المعرني للتفاعل في 
استرجاع المعلومات» هناك ثلاثة عناصر رئيسة (أهداف المعلومات» وتصميم نظام 
استرجاع المعلومات» والبيئة الاجتماعية أو المؤسساتية)» بالإضافة إلى الفضاء المعرفي 
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للمستفيد» الذي يشمل الحالة المعرفية الراهنة» والمشكلة أو الهدف» والشك» والحاجة 
المعلوماتية» والسلوك المعلوماتي. ويتم التركيز في الأنموذج المعرفي على العملية 
المعرفية للمستفيد. 

وللأنموذج المعرفي الكثير من التطبيقات المختلفة؛ فقد صمم بلكن وأودي 
وبروكس )1982( Belkin, Oddy and Brooks‏ على سبيل المثال» نظاما تفاعليا 
لاسترجاع المعلومات (السؤال والإجابة على سبيل المثال) للكشف عن الاحتياجات 
المعلوماتية للمستفيد. وتحليل بروتوكولات التفكير بصوت مرتفع» أسلوب آخرء 
يطبق في فهم الأنشطة المعرفية للمستفيدين» عندما يكونوت بصدد البحث عن 
المعلومات (ر اجع على سبيل المثال 1982 .(Gorman, et al., 2002; Ingwersen,‏ 
وقد تناول بتيجرو وفايدل وبروس )2001( «Pettigrew, Fidel and Bruce‏ 
الطرق المعرفية للبحث في سلوكيات البحث عن المعلومات» بالشرح المفصلء على 
الرغم من أن تعريفهم للأطر المعرفية» يبدو أوسع بكثير من التعريف المتبع في هذا 
الكتاب. وتكمن أكبر مظاهر قوة الأنموذج.المعرفيء في تركيزه على إدراك المستفيدى 
ذلك الإدراك الذي يعد عاملا حاسم بالنسبة لعملية استرجاع المعلومات. كيف 
تتشكل الحاجة المعلوماتية؟ كيف تتحول إلى استفسار بحث؟ كيف يتم تقييم النتتائج 
المسترجعة؟ وتتعلق كل هذه الأسئلة بإدراك المستفيد» ويدف الأنموذج المعرفي 
لتقديم إجابات لمثل هذه الأسئلة. 


والأنموذج المعرفي موجه نحو المستفيد الأمر الذي يميزه عن الناذج الأخرى 
لاسترجاع المعلومات» التي تركز على مكوني أو عنصري المعلومات أو النظام, في 
عملية استرجاع المعلومات. فالمستفيدون يتسمون بالديناميكية» وكذلك الحال أيضا 
بالنسبة لاحتياجاتهم المعلوماتية؛ إذ إن لمختلف المستفيدين احتياجات معلوماتية 
مختلفة. ومن شأن الاحتياجات المعلوماتية للمستفيد نفسه» أن تختلف من وقت لآخر» 
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ومن مكان إلى آخر» بل إنها يمكن أن تتغير أثناء التفاعل مع النظام.كما أن الأنموذج 
المعرفي هو وحده القادر على التعامل مع ديناميكيات المستفيدين» فيا يتعلق بأنشطتهم 
المعرفية في استرجاع المعلومات. وينبغي أن يركز استرجاع المعلومات على المستفيد» 
ومن ثم» فإن التوجه نحو المستفيد في الأنموذج المعرفي» يمكن أن يسهم في بناء نظم 
di ys‏ لاسترجاع المعلومات تراعي ظروف المستفيد. 
وعلى الرغم من أن الأنموذج المعرفي يبدو واعدا إلى حد بعيد» بالنسبة للارتقاء 
بمستوى أداء استرجاع المعلومات» فإن فهم البشر للأنشطة المعرفية» لا يزال محدوداء 
فك نبه إنجورسن )1996( :Ingwersen‏ 
فإن الحاسبات (أو الكتب بالنسبة لهذا الأمر) تلتزم 
بمسلات ثابتة محددة سلفاء بين| لا يمكن لأولئك البشر أن يتم 
التكهن بهم على المستوى الفردي؛ إذ mel‏ يتشكلون كما هم بناء 
على الخبرات العارضة» والدلاليةء والعاطفية. )6 (p.‏ 
والأنشطة المعرفية للمستفيدين في استرجاع المعلومات» أمر لا يمكن التكهن 
به؛ نظرًا لطبيعة الإدراك؛ ولأننا d‏ نستوعب بعد العملية ا معرفية كاملة. وقد اقترح 
إنجورسن )1996( Ingwersen‏ التنظيم المتعدد poly-representation‏ للفضاء 
المعرفي للمستفيدء والفضاء المعلوماتي لنظم استرجاع المعلومات (كتوفير نقاط 
الوصول المتداخلة معرفياء كالكلات المفتاحية» والواصفات» والاستشهادات 
المرجعيةء لأغراض الاسترجاع على سبيل المثال) كطريقة للتغلب على مشكلة الشك» 
وعدم القابلية للتنبؤ في يتعلق بالإدراك. وقد تكرر الاقتراح نفسه. من جانب كل من 
إنجورسن ويارفلين )2005( -Ingwersen-and Jarvelin‏ 
وفضلا عن ذلك» فإن الإدراك ينطوي على بعض القيود الداخلية؛ فطاقة 
الذاكرة البشرية قصيرة المدى» على سبيل المشال» وهي سبع كتل chunks‏ زائد أو 


383 


ناقص اثنتين )1956 (Miller,‏ والكتلة مقياس لأصغر وحدة معلوماتية ذات دلالة. 
فرقم الحاتف في دولة cle‏ على سبيل المثال» يتكون من ثلاث كتل من المعلومات» هي 
رمز المنطقة YAY)‏ على سبيل المثال) ورمز الإقليم PTV)‏ على سبيل المثال) والأرقام 
الأربعة الأخيرة A149)‏ على سبيل CSL‏ والمضمون المباشر لما انتتهى إليه ملر 
Miller‏ بالنسبة للمستفيدين» في عملية استرجاع المعلومات» هو قدرتهم المحدودة 
على تجهيز المعلومات. فإذا كان أحد نظم استرجاع المعلومات يقدم اثني عشر خيارا 
Lae‏ في الوقت نفسهء فإنه يمكن للمستفيدين مواجهة مشكلة؛ OV‏ مقدار المعلومات 
المقدمة يزيد عن طاقة استيعاب ذاكرتهم قصيرة المدى؛ ومن ثم فإن نظم استرجاع 
المعلومات» لا ينبغي أن يكون tle‏ على سبيل JEN‏ قائمة اختيار تشتمل على أكثر من 
تسعة خيارات. ومن ناحية أخرى يمكن للمستفيد أن يشعر أيضا بالإرهاق» أو الملل» 
أو القلق» عندما يقدم له الكثير من الاحتمالات. ويمكن لكل هذه العوامل أن تؤثر في 
الطاقة المعرفية أو الإدراكية للمستفيد. وينبغي أن يضع.الأنموذج المعرفي لاسترجاع 
المعلومات» مثل هذه العوامل في الحسبان. 

والبشر هم أكثر المخلوقات تعقدا في الكون. وأقل جوانب البشر قابلية للفهم 
هو إدراكهم» في حين يحاول الأنموذج المعرفي التصدي لمشكلة استرجاع المعلومات» 
من المنظور المعرفي. فالنهج مهم» وموجه فعلاً نحو ال هدف مباشرة, إلا أنه يواجه أيضا 
تحديات ضخمة. 


النماذج الأخرى لاسترجاع المعلومات التى تركز على المستفيد: 
ازدهرت بحوث الاحتياجات المعلوماتية والمستفيدين» في السنوات الأخيرة. 
فوفقا لما انتهى إليه جوليان وداجان )2000( Jullien and Duggan‏ شكلت 
دراسات الاحتياجات المعلوماتية» platy‏ المعلومات» والإفادة من المعلومات؛ ما 
يصل إلى حوالي ۸ بالمئة» من الإنتاج الفكري البحثي في علم المكتبات والمعلومات» 
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وقت إجراء دراسته|. ومن المحتمل أن تكون هذه النسبة المئوية قد ارتفعت منذ ذلك 
الحين. وكثير من هذه الدراسات مكرس للناذج والمداخل المفاهيمية» التي تركز على 
المستفيد في استرجاع المعلومات (راجع على سبيل المثال Bates, 1989; Belkin et‏ 
(al, 1995; Dervin, 1992; Kublthau, 1993; Wilson, 1999‏ ويمكن 
الاطلاع على مراجعات إضافية هذه الدراسات 5 كيس )2007( ‘(Case‏ وانجورسن 
وييرفلين 2005( Ingwersen and Jarvelin‏ وسبنك وكول Spink and Cole‏ 
)2006(« وولصون )1999( Wilson‏ إذ استقصى المؤلفون» وقارنوا واستكشفوا 
نماذج متعددة» تركز على المستفيد» وعلى نحو Y‏ يستهان به من التفصيل. 

ولا تتسم تلك النماذج التي تركز على المستفيد بالوفرة في الكم فحسبء وإنم) 
تشكلت أيضا بتوجهات متنوعة أيضاء ومن زوايا نظر مختلفة. وبذلك يحاول الباحثون 
تقسيم مثل هذه الناذج إلى فئات» وفقا لمعايير معينة» من أجل مساعدة الآخرين على 
تحقيق فهم أفضل LA‏ فقد ذهب ييرفلين وولصون Jarvelin and Wilson‏ 
)2003(« على سبيل المثال» إلى أن بعض الناذج ذات طابع موجز (راجع على سبيل 
المثال 1996 (Ellis, 1989; Ingwersen,‏ بينا النماذج الأخرى أكثر تحليلا (راجع 
على سبيل Belkin, Oddy, & Brooks, 1982; Bystron & Jarvelin, JUJ‏ 
1995( ومن ناحية خر ی قسم سبنك وكول )2006( Spink and Cole‏ النماذج 
التي تركز على المستفيد» إلى ثلاث فئات؛ هي منظور حل المشكلات (راجع على سبيل 
المثال Belkin, Oddy & Brooks, 1982; Kuhlthau, 1993; Wilson,‏ 
1999( والتماس معلومات ال حياة اليومية» وإضفاء المعنى (راجع فل سيل لقال 
(Dervin, 1992; Huotari & Chatman, 2001‏ والتزود بالمعلومات (ر اجع 
على سبيل ا (Bates, 1989; Pirolli & Card, 1999 JUL‏ وبصرف النظر عن 
الطريقة التي يتم بها اختبار النماذج bed‏ بعد فإنها جميعها تتسم بخاصية واحدة 
مشتركة؛ ألا وهي وضع المستفيد في مركز الأنموذج الذي يتم تصميمه. 
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وقد أشار ولصون )2008( Wilson‏ في وقت لاحقء إلى أن تطور بحوث 
استرجاع المعلومات» التي تركز على المستفيد» قد أفضى إلى التمييز بين احتياجات 
الأوساط الأكاديمية إلى أعمال تستند إلى أساس نظري» واحتياجات ال مارسين إلى 
توجيهات الارتقاء بمستوى الخدمات. كذلك بيّن ولصون أن الفصل بين البحث 
والمارسة» يتحقق إلى مدى لا يستهان tay‏ فقد كانت البحوث المبكرة يجريها مارسون» 
أما البحوث الراهنة فيتم إجراؤها فى الوقت الذي تسيطر فيه الأوساط الأكاديمية على 
المشهد. إلا أن الفصل بين البحث والمارسة يمكن أن يؤدي إلى لمحاوف في المجال؛ 
E OY Ls‏ الذي ر عل اله يكن أن يكرن ينا ML had‏ عن نهد 
مضامين تطبيقية يعتد بها في استرجاع المعلومات» مهما كان من الممكن أن تتوافر له من 
مقومات الروعة. ويميل الفصل بين البحث والتطبيق أو المارسةء OY‏ يفضي إلى نتائج 
لا أهمية هاء في جال استرجاع المعلومات. يضاف إلى ذلك أنه ربا يكون قد آن الأوان 
لتأمل الناذج التي تركز على المستفيد» التي صممت فعلاء والبحث في السبل المحتملة 
لتطبيقهاء لمساعدة المستفيدين على الارتفاع بمستوى أدائهم» في أنشطة التماس 
المعلومات واسترجاعها. وبين| يبذل بعض الباحثين (راجع على سبيل Case, SLA‏ 
Ingwersen & Jarvelin, 2005; Wilson, 1999‏ ;2007( جهودا طيبة في هذا 
الصدد» تدعو الحاجة؛ ولاشك إلى المزيد من العمل في هذا المجال سريع التطور. 


تفاعل المستفيد مع النظام: 


واجهة المستفيد cser interface‏ مصطلح تم سكه لوضع ما يتعلق بالمستفيد 
على وجه التحديد, في تنظيم المعلومات واسترجاعها في الحسبان؛ فواجهة التعامل هي 
ما يراه المستفيد ويسمعه ويلمسه» في التفاعل مع النظام )1991 (Shaw,‏ إلا أن 
مصطلح الواجهة يبدو ساكناً static‏ ولا يركز إلا على نقطة واحدة لتفاعل المستفيد 
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مع النظام. ولهذا السبب نستعمل مصطلح ”تفاعل المستفيد مع النظام” user-‏ 
system interaction‏ أو interaction “ | cla!”‏ ببساطة» في هذا الكتاب» 
للدلالة على الأنشطة الديناميكية التي تدور بين المستفيد ونظام استرجاع المعلومات. 
والمصطلح الآخر الذي ينبغي أن يحظى 2 ببعض التوضيح» في هذا الفصل» هو pela‏ 
الإنسان مع الحاسب «human-computer interaction‏ أو تفاعل الحاسب مع 
الإنسان ds -computer-human interaction‏ يستعمل أي من المصطلحين 
في هذا الكتاب؛ OY‏ كلا من ”الحاسب“ و ”الإنسان“ لها معانٍ أوسع مما يتعلق 
بالنظام والمستفيد» في تنظيم المعلومات واسترجاعهاء أي المجال الذي هيدف هذا 
الكتاب إلى تغطيته. 


أساليب تفاعل المستفيد مع النظام: 

يمكن لتفاعل المستفيد مع النظام» في تنظيم المعلومات واسترجاعهاء أن يحدث 
بي من الأشاليب التالية: لغة إصدار الأوامر command language‏ والاختيار 
من قائمة ابكار أت menu selection‏ والتشغيل التصويري graphical‏ 
0 وتعبئة ة الناذج أو الاستارات form filling‏ والرو Ll‏ الفائققة 
chyperlinks‏ وحوار اللغة الطبيغية natural language dialog‏ ومن الممكن 


أيضا تطبيق هذه الأساليبء تزامنياء أي بالتوازي لتنظيم المعلومات واسترجاعها. 
لغة إصدار الأوامر: 

لقد كانت لغة إصدار الأوامر هي الشكل الأول زمنياء الذي تم وضعه لتفاعل 
المستفيد مع النظام» وكانت هذا الشكل السيطرة في نظم استرجاع المعلومات» وخاصة 


نظم الخط المباشرء مثل ديالوج DIALOG‏ في العهود المبكرة لتنظيم المعلومات 
واسترجاعها. وني هذا الأسلوب يضغط المستفيد على مفاتيح لغة إصدار الأوامر (أي 
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اللغة الاصطناعية المصممة خصوصًا لأغراض الاسترجاع)؛ وذلك لإعطاء الأوامر 
للنظام لإنجاز وظائف معينة (كالبدء والبحث على سبيل المثال). ومصطلحات لغة 
إصدار الأوامر موجزة» مثل ”تسجيل logoff “ey Ft‏ لإنباء عملية البحث وترك 
نظام الاسترجاع. والميزة الأخرى للغة إصدار الأوامر» هي سرعة التفاعل (Large,‏ 
.Tedd & Hartley, 1999)‏ وبالمقارنة بأشكال التفاعل الأخرى» فإن لغة إصدار 
الأوامر أسرع بكثير» في الحصول على الاستجابات من النظام؛ لأنه ليست هناك أي 
خطوات إضافية (كترجة قائمة الخيارات إلى أوامر للنظام على سبيل (JUL‏ يتم 
تنفيذها. وبذلك المعنى يكون التفاعل بين المستفيد والنظام مباشرا. كا أن للسرعة * 
قيمتها أيضاء في بيئة تتوقف فيها رسوم الاسترجاع إلى حد بعيد» على وقت الارتباط 
وتكلفة الاتصالات. وفضلا عن ذلك يجد المستفيدون مرونة في اختيار أي الأوامر 
يمكن استخدامهاء ولا يقتصرون على الخيارات التي ترد في قائمة الخيارات على سبيل 
المثال. ونتيجة لذلك يستطيع المستفيدون التحكم في.التفاعل على نحو مباشر. 

غير أن لغة إصدار الأوامر» كأسلوب للتفاعل» لا تبدي تعاطفا مع المستفيده 
وعلى المستفيد أن يتعلم هذه اللغة» وأن يتمرس che‏ ويطبقها على نحو منتظم» نظرا 
لطابعها الاصطناعي. ويمكن لمعنى الأمر ألا يكون في بعض الأحيان واضحا وصريجا 
بالنسبة للمستفيد؛ فكلمة select “fol”‏ على سبيل JEN‏ تقوم مقام ”ابحث عن“ 
search for‏ في لغة ديالوج. يضاف إلى ذلك أنه قل يكون هناك توحيد 
uniformity‏ بين لغات إصدار الأوامر» من حيث النحو أو النظم syntax‏ والدلالة. 
فمن الممكن للغة إصدار الأوامرء بالنسبة لإنهاء جلسة البحث» أن تشتمل على 
exit “CI‏ في نظام cle‏ و تسجيل logoff “gaH‏ في نظام آخر. ومهما يكن فإن 
التفاعل القائم على لغة إصدار الأوامر قلا يكفل للمستفيد المساعدة والإرشاد. فيا 
يتعلق le‏ يتعين عليه القيام به. ويمكن للنظام على سبيل المثال» أن يستعجل ”أدخل 
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أمرًا “enter a command‏ ولا يلمح بشأن أي أمر يمكن إدخاله. ونظرالهذه 
الصعوبات» فإن لغة إصدار الأوامر غالبا ما تكون أسلوب التفاعل بين نظام ' 
استرجاع المعلومات والوسطاء (اختصاصيو المكتبات واختصاصيو إجراء عمليات 
البحث على سبيل (JEU‏ لا بين نظام استرجاع المعلومات والمستفيدين النهائيين. 
الاختيار من قائمة الخيارات: 

الاختيار من قائمة الخيارات» أسلوب للتفاعل صمم جزئيا للتغلب على أوجه 
قصور لغة إضدار الأوامز. ولقد كانت نظم الأسطوانات المكتنزة» والفهارس المتاحة 
على الخط المباشرء أول أنواع نظم استرجاع المعلومات التي تستخدم أسلوب التفاعل 
المعتمد على الاختيار من قائمة الخيارات؛ إذ يتفاعل المستفيد مع النظام بالاختيار من 
الخيارات المتاحة» المسجلة في قائمة الخيارات؛ الأمر الذي يفيد من قدرات البشر 
بالنسبة للإدراك» التي تفوق قدرات التذكر. ومن ثم» فإن المستفيد في أسلوب 
الاختيار من قائمة الخيارات؛ لم يعد بحاجة OY‏ يتذكر الأوامر والعمل بهاء كما في 
أسلوب لغة إصدار الأوامر. كذلك تتسم قوائم الخيارات بالتحديد بالنسبة لعملية 
الاسترجاع. وتختلف خيارات القائمة التي تظهر» على سبيل SL‏ أثناء جلسة 
البحثء عن تلك التي تظهر وقت مشاهدة نتائج عملية البحث. وفي مقابل ذلك على 
المستفيد أن يقرر متى يستعمل أي أمر» في أسلوب لغة إصدار الأوامر. يضاف إلى 
ذلك أن المساعدة تظهر في شسكل قائمة الخيارات في متناول المستفيد» في أسلوب 
التفاعل القائم على قائمة الخيارات. 

وكأسلوب للتفاعل» يبدو الاختيار من قائمة الخيارات» أكشر تعاطفا أو أكثر 
مراعاة لظروف المستفيد» Le‏ هو عليه الخال في لغة إصدار الأوامر. إلا أن الاختيار من 
قائمة الخيارات لا يتمتع بسرعة لغة إصدار الأوامر؛ إذ أنه يتعين على المستفيد أن 
يتفاعل مع النظام عن طريق قائمة الخيارات» وقد يستغرق الاختيار من قائمة 
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الخيارات وقتا أطول من كتابة الأمر» وخصوصا عندما يتوافر بالنظام عدة مستويات 
لقوائم الخيارات. ومن الممكن أن يقع العبء الزائد على الذاكرة» إذا كان عدد 
خيارات القائمة يزيد عن طاقة الذاكرة قصيرة المدى (أي رقم ملر Miller‏ السحري 
سبعة زائد أو ناقص اثنين» الذي تناولناه في )١ /۲ /٠١‏ كذلك يفتقد المستفيدون 
المرونة في التفاعل مباشرة مع النظام؛ نظرا OY‏ اختيارهم يقتصر على ما يمكن أن 
يوفره النظام. إلا أنه بالنسبة للمستفيدين المبتدئين يفضل أسلوب الاختيار من قائمة 
الخيارات» عند التفاعل مع نظم استرجاع المعلومات. 


الأسلوب التصويري للتفاعل: 

يتم تطبيق الأسلوب التصويري لتفاعل المستفيد مع النظام» بواسطة الأيقونات 
icons‏ أو الرموز التصويرية» والأزرار (بما في ذلك أزرار المذياع) والنوافذ» والخرائط 
التي يمكن النقر عليها. ويتفاعل المستفيد مع النظام بالتعامل (بالإشارة والنقر على 
سبيل المثال) مع مثل هذه التمثيلات البصرية. ويعتمد الأسلوب التصويري للتفاعل 
على الرموز في نظم استرجاع الإنترنت. ويستخدم أسلوب التفاعل هذا تمشيلات 
لموضوعات الكلات الحقيقية (كأيقونة الطابعة للطباعة» وأيقونة الأسطوانة لحف ظ 
الملفات» على سبيل المثال)» ووسيمات المفاهيم (كالمفتاح الموسوم للبحث على سبيل 
المثال) بوصفه الواجهة بين المستفيد والنظام. ومن الممكن للنوافذ أن تفتح» ويعدل 
حجمهاء وتغلق» Las‏ للحاجة بالنسبة للتفاعل. وتكفل الخرائط القابلة للنقرء 
للمستفيد استرجاع المعلومات» بمجرد النقر على النقطة التي تمثلها. فمن الممكن» على 
سبيل JN‏ لنقرة على مدينة نيويورك» على خريطة وطنية للولايات المتحدة 
الأمريكية» أن تفضي إلى عرض خريطة المدينة. ويمكن لخاصتي التكبير والتصغيرء 
إذ كانتا تحظيان بالدعم» أن تكونا مفيدتين إلى أبعد حدء في التعامل مع الخرائط 
القابلة للنقر. 
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ويمكن للأسلوب التصويري للتفاعل أن يتخذ أشكالا ختلفةء إلا أن هذا 
الأسلوب بوجه عام» يكفل للمستفيدين اليسر عندما يتفاعلون به؛ فتصوير الأنشطة 
التي تنطوي عليها مهام الاسترجاع» يؤدي إلى تجنب زيادة تحميل المستفيد بالأعباء 
المعرفية (كالاختيار من بين قائمة طويلة من الخيارات» على سبيل COL‏ ويمكن 
للمستفيد أن يجد متعة في أسلوب التفاعل التصويري» الحي والملون في غالب 
الأحيان. وتكفل التعددية الكامنة في هذا الأسلوب» للمستفيد القدرة عل إنجاز 
مهمة الاسترجاع على نحو .أكثر كفاءة؛ فمن الممكن» على سبيل SLL‏ للمستفيد أن 
. يختار أيقونات للتعامل مع المهام المحددة واضحة المعالم» في استرجاع المعلومات 
(كالطباعة على سبيل المثال) بين| يختار المفاتيح للأمور المجردة (كالبحث البوليني على 
سبيل CSU‏ 

إلا أنه لا ينبغي الاستهانة بالصعوبة التي ينطوي عليها تطوير الأسلوب 
التصويري للتفاعل؛ فبعض العمليات في استرجاع المعلومات (كالاتجاه نحوقمة 
الوثيقة» على سبيل المثال) لا يمكن تمثيلها على النحو المناسب بالأيقونات. يضاف إلى 
ذلك أنه من الممكن للتفاعل التصويري أن يكون غير ضروري بالنسبة لأنشطة معينة 
في استرجاع المعلومات (كإدخال الاستفسارات على سبيل المثال). ويمكن لمعنى 
التمثيلات التصويرية» مالم يكن قد تم اختياره على نحو مناسب» أن يكون مضللا أو 
يساء فهمه. وتشغل التصميات التصويرية للتفاعل المزيد من حيز الشاشة» ومن ثم 
lela‏ قد لا تفسح Yle‏ للمعلومات القيمة )2005 (Shneiderman & Plaisant,‏ 
كا أن الوقت اللازم للتفاعل في الأسلوب التصويري» أطول بكثير مما هو عليه في 
أسلوب لغة إصدار cal VI‏ أو أسلوب الاختيار من قائمة الخيارات» نظرا للمواد 
التصويرية. ومن ثم» فإنه يمكن لاسترجاع المعلومات بهذا الأسلوب أن يكون بطيئا 
وثقيلاء وهو أمر قد لا يثير حاوف المستفيد؛ OV‏ وقت الارتباط Y‏ يشكل سوى 
القليل في حساب تكلفة الاسترجاع في مثل هذه النظم لاسترجاع المعلومات (كنظم 
استرجاع الإنترنت على سبيل المثال). 
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النماذج الأخرى لتفاعل المستفيد مع النظام: 

الاستمارات أحد أساليب التفاعل بين المستفيد والنظام؛ إذ يقوم المستفيد عند 
اتباع هذا الأسلوب بتسجيل عناصر كمصطلحات البحث» ويرسم حدود البحث» 
على استمارة يوفرها النظام. وينطوي أسلوب تعبئة الاستارات فعلا على خواص 
قوائم الخيارات المنسدلة pull-down‏ والأزرار. والفهارس المتاحة على الخط المباشر» 
ونظم استرجاع الإثترنت» نوعان من نظم استرجاع المعلومات التي غالبا ما تدعم 
أسلوب التفاعل هذا. فالمستفيد يقوم بإجراء عملية البحث بالاطلاع وتعبشة , 
الاستمارة. وليست هناك قرارات صعبة يتخذها المستفيد» (Gly‏ يرشد النظام المستفيد 
tlre Jt‏ اة الامتفسان دي ووجه القصور الواضح في هذا rere,‏ 
هو افتقاده للمرونة في تفاعل المستفيد مع النظام؛ نظرا لأن المستفيد مقيد بم| 
يرد في الاستمارة. | 

وتمثل الروابط الفائقة شكلا آخر للتفاعل. وهناك بعض أوجه التشابه بين 
الروابط الفائقة والاختيار من قائمة الخيارات؛ حيث يتفاعل المستفيدون ببذين 
الأسلوبين بالنقر على أحد عناصر قائمة الخيارات» أو إحذى الروابط الفائقة» التي 
تفضي إلى كيان آخر (قائمة خيارات أو إحدى الوثائق الأخرى على سبيل المثال). إلا 
أن الروابط الفائقة لا:يتعين تقديمها في cle gat‏ كما في حالة الاختيار من قائمة 
الخيارات. ومن الممكن للروابط الفائقة أن تنشأ حيث| تدعو الحاجة إليهاء منفردة أو 
مع روابط فائقة أخرى. وكا بينا في OB V/V/V‏ بنيان الرابطة الفائقة» يشجع على 
التصفح؛ ومن ثم فإن الروابط الفائقة تطبق على نطاق واسع. في نظم استرجاع 
العلومات» التي تركز على التصفح. وياهو! Yahoo!‏ نظام استرجاع الونترنت القائم 
على الآدلة» مثال متاز لأسلوب التفاعل القائم على الروابط الفائقة. ويقوم المستفيد 
بإنجاز مهام الاسترجاع بالتصفح عبر الفئات المرتبطة ارتباطا فائقاء التي يطورها 
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ياهو!. ويكمن وجه القصور الرئيس للروابط الفائقة كأسلوب للتفاعل» في بنيانها 
الشبكي. فمن الممكن للمستفيد أن يضل طريقه بسهولة عند التفاعل مع النظام باتباع 
الروابط؛ لأن الروابط الفائقة تتبع البنيان الشبكي» وغالبا ما يشبه البنيان الداخلي 
للروابط الفائقة المتاهةء لا المجموعة محكمة البنيان من الروابط. ومما لا شك فيه» 
أنه كلما زاد عدد الروابط الفائقة في نظام الاسترجاعء أصبح النظام أكثر إرباكا 

وقد بدأت اللغة الطبيعية تستخدم في التفاعل بين المستفيد والنظام» ويبدي 
تقديم الاستفسارات باللغة الطبيعية لنظام استرجاع المعلوماتء أحد الجهود الضخمة 
في هذا الصدد. فنظام آسك دوت كوم Ask.com‏ (الذي كان يسمى من قبل سل 
جيفز (Ask Jeeves‏ يكفل للمستفيد إدخال الاستفسارات» باستعمال الجمل الكاملة 
(مثل: ما معالحة اللغة الطبيعية؟). وأكبر مزايا استعمال اللغة الطبيعية» في التفاعل بين 
المستفيد والنظام» هي طابعها الصريح المباشر؛ إذ يمكن لأي تمثيل للاستفسار أن 
يسفر حتها عن تحريف وتغيير في المعنى؛ ومن ثم فإن المستفيد في أسلوب اللغة الطبيعية 
للتفاعل» قد لا يكون بحاجة OF‏ يفسر معنى التمثيلات التي تنشأ لأغراض التفاعل 
(مثل لغة إصدار الأوامرء والأيقونات» وعناصر قائمة الخيارات). وبينما تبدو اللغة 
الطبيعية شكلا مرغوبا فيه إلى أقصى حد للتفاعل بين المستفيد والنظام» فإن التطبيق 
الناجح «lb‏ يتوقف في النهاية على تقدم البحوث حول معالجة اللغة الطبيعية» وهذا 
موضوع نستكشفه في الفصل الثاني عشر. 

ويرتبط ارتباطا وثيقا بأسلوب اللغة الطبيعية للتفاعل» استخدام الصوت في 
نظم استرجاع المعلومات؛ فالمستفيد في هذه الحالة يتفاعل مع النظام عن طريق اللغة 
المنطوقة لا اللغة المكتوبة. ويعتمد هذا الأسلوب للتفاعل بقوة» على تقنيات التعرف 
على الأصوات, التي لا تزال في مرحلة التطور. 
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وقد بدأت واجهةالمستفيد العضوية organic user interface (OUD‏ 
تظهر في الإنتاج الفكري (راجع على سبيل المثال Vertegaal & Poupyrev,‏ 
8 كشكل محتمل لتفاعل المستفيد مع النظام. وقد اختير اسم هذا الشكل لأن: 
)1( التقنيات الداعمة بالنسبة لبعض أهم تطورات واجهة المستفيد العضوية» هي 
الإلكترونيات العضوية» و(۲) أن ملايين الأشكال العضوية التي نلاحظها في 
الطبيعة» مذهلة في تنوعهاء ومرونتهاء وقابليتها للنقل أو التحول» وتكيفها الطبيعي» 
واحتمالاتها التطورية» بين| تبدو مرنة ومن الممكن الاعتاد عليها في الوقت نفسه. وقد 
أحصى فر LA‏ وبوبيريف )2008( Vertegaal and Poupyrev‏ ثلاثة جوانب» 
بده gly‏ المد pal‏ ارا أن التشلات سارى “Heyy cal ball‏ 
العرض Lal‏ هي وسيلة المدخلات. وشاشة اللمس بمثابة مثال في هذه الحالة. ويقدم 
ركيموتو )2008( Rekimoto‏ المزيد من التوضيح هذا الجانب لواجهة المستفيد 
ci pall‏ بأمثلة تفصيلية» مثل هولووو ل «Holowalll‏ وسمارت سكين Smartskin‏ 
وثاني هذه الجوانب أن الوظيفة تساوي الشكل؛ إذ يمكن للعرض أن يتخذ أي شكل. 
وتحل واجهة المستفيد العضوية محل المصفوفة المستطيلة الجامدة: بالمزيد من المفاهيم 
المائعة fluid‏ التي تبدو أسطح رقيقة» مرنة ولمسية ctactile‏ مهيأة للشكل والحیز (Co‏ 
Pashinkov, 2008)‏ &. ويمكن لجهاز قراءة الكتب الإلكترونية الذي يمكن طيه. 
أن يصبح حقيقة واقعة» باستخدام تقنيات عرض واجهة المستفيد العضوية الناشئة. 
أما الجانب الثالث لواجهة المستفيد العضوية» فهو ذلك الشكل متواصل التدفق. 
follows flow‏ (أي تدفق تفاعل المستفيد): وبإمكان العروض تغيير شكلها لإنجاز 
الوظائف اللازمة» أثناء تفاعل المستفيد مع النظام. وما ينطوي عليه هذا الجانب هو ما 
يسمى التصميم الحركي» الذي يتم من خلاله إدخال القابلية للنقل الفيزيائي في 
الواجهة )2008 .(Parkes, Poupyrev & Ishii,‏ .ولا كانت واجهة المستفيد 
العضوية لا تزال رؤية لم تتحقق بعد» فإنه من السابق لأوانه كثيراء معرفة ما لها وما 
عليها كأسلوب للتفاعل بين المستفيد والنظام. 
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الأسلوب الهحين للتفاعل: 

شهدت السنوات القريبة الماضية ظهور أسلوب هجين للتفاعل» وخصوصا في 
نظم استرجاع الإنترنت. ومن الممكن لأي تجمع من أساليب التفاعل التي سبقت 
معالجتهاء أن يشكل واجهة هجيناء على الرغم من أن لغة إصدار الأوامر قلا تندمج» 
نظرا لما يكتنفها من أوجه القصور؛ فإن نظام إكزاليد Exalead‏ وهو نظام لاسترجاع 
الإنترنت. مقره فرنساء يدعم الاختيار من قوائم الخيارات» والروابط الفائقة» ولغة 
إصدار الأوامر (بالنسبة للمعاملات البولينيةء ومعاملات التقارب وما شابه ذلك) 
فضلا عن الواجهة التصويرية. ويمكن للأسلوب الهجين للتفاعلء أن يقضي على 
أوجه ا التي تكتنف أسلوبا بعينه» ويرتفع بمستوى كفاءته ومراعاته لظروف 
المستفيد. والواقع أننا قلا نشهد التفاعل أحادي الأسلوب» في نظم استرجاع 
المعلومات التي تطورت حديثا؛ نظرا لأن لكل أسلوب للتفاعل ما يكتنفه من 
أوجه القصور. 
الأبعاد الأخرى لتفاعل المستفيد مع النظام: 

فضلا عن أسلوب التفاعل» هناك جوانب أخرى ينبغي أن يضعها المستفيد في 
ا لحسبان» عند التفاعل مع نظام استرجاع المعلومات. وتشمل هذه الأبعاد خصائص 
العرض» وخيارات المخرجات» ومقومات المساعدة. 
خصائص العرض: 

يتفاعل المستفيد مع نظام استرجاع المعلومات عن طريق شكل معين من 
العرض» إلا أن الأدوات المادية اللازمة للتفاعل (كلوحة المفاتيح أو الفأرة على سبيل 
المثال) تخرج عن حدود مجال هذا الكتاب. ومن الممكن للتفاعل أن تتحدد معالمه بمثل 
خصائص العرض هذه» كاللون» وأشكال الحروف. والكثافة» وإخراج الشاشة. 
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ويوضح إخراج الشاشة كيف يتم عرض المعلومات اللازمة لأغراض 
التفاعل» على واجهة التعامل (شاشة حاسب عادة)؛ فهل يدعم الإخراج الأطر 
المتراكبة» أو النوافذ المتعددة؟ هل يحتاج المستفيد إلى التوجه إلى أعلى أو إلى أسفل ليرى 
كل المعلومات المقدمة؟ ومن الممكن للاستخدام المكثف لخاصية التراكب 
coverlaying‏ أو الأعداد الكثيرة من ار أو النوافذ» في عرض Lely‏ أن يؤثر في 
قدرة المستفيد على التفاعل مع النظام بكفاءة. وكذلك الحال أيضاء فإن معظم 
المستفيدين (المبتدئين على وجه الخصوص) غير متمرسين في أساليب التنقل أو الشف 
8 . ومن المفضل [slo‏ عرض كل المعلومات على شاشة واحدة» إن أمكن» لا 
على شاشات متعددة. 

ويحكم نوع الخط وأسلوبه وحجمه» جودة عرض المعلومات النصية. والحد 
الأدنى للمواصفات بالنسبة لعرض النصوصء هو الوضوح والقابلية Bel AU‏ ويرى 
جاليتز )1997( Galitz‏ أنه لا يمكن استعمال سوى نوعين من الخطوط (مثل الروماني 
الجديد للتايمز Times New Roman‏ أو الساعي (Courier‏ وشكلين مسن 
الأحرف (مثل المألوف regular‏ والمائل italic‏ وثلاثة أحجام» للعرض الواحد. 
وينبغي تجنب أنواع الخطوط غير الواضحة أو غير المقروءة» أو أحجام الخطوط 
متناهية الصغر. ويمكن لنمط الفط إذا ما استعمل على النحو الملائم» أن ييسر 
عملية التفاعل. 


GG 

التحديد المستوى المريح للمستفيد» عند التفاعل مع النظام. ويحدد عدد الألوان 
وتجميع أو خليط الألوان ما إذا كان العرض النهائي يبدو مستساغا للمستفيد أم لا. 
وينبغي أيضا اختبار الدرجات المناسبة للتباين واللمعان؛ لأن الإفراط في أي من 
العاملين» يمكن أن يتسبب في عدم راحة أعين المستفيدين. ويدخل لون الخلفية» 
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وصورة الخلفية في هذه الفئة من خصائص العرض. ويتبين من الخبرة أن الأسود على 
الأبيضء تجمع جيد بوجه عام بالنسبة للعرض. وينبغي مراعاة الحيطة والحذر عندما 
تستخدم الصور كخلفيات؛ نظرا لأنه من الممكن للصور أن تلقي بظلا ها على 
المعلومات المهمة الأخرى التي ينبغي عرضها. كذلك يمكن لتحميل مثل هذا العرض 
أن يستغرق وقتا طويلا. وهذه الأسباب» فإن بعض نظم استرجاع الإنترنت» التي 
كانت تستخدم خلفيات من الصور في أيامها المبكرة» سرعان ما أقلعت 
عن هذا الأسلوب. 

وكثافة العرض عامل آخرء يمكن أن يكون له تأثيره على سهولة التفاعل بين 
المستفيد والنظام؛ فكم من المعلومات على سبيل المثال» يمكن أن يعرض على شاشة 
واحدة؟ وبين) تبدو المواصفات التفصيلية حول الكثافة غير محتملة؛ نظرا OV‏ عوامل 
كمجموعات الأحرف ها تأثيرها أيضا على الكثافة» فإنه ينبغي مراعاة الدرجة 
القصوى للكثافة في موقف معين. ولا يمكن بوجه عام لأي من الشاشة المزدحمة أو 
الفراغ الزائد عن الحد» أن يحظى بالترحيب من جانب المستفيد. 

ومن الممكن للمؤثرات الخاصة» كتسليط الضوء و الوميض» والعرض المرئي 
العكسي cinvese video‏ أن تعمل جميعها على تحقيق نتائج معينة في تفاعل المستفيد 
مع النظام» إذا ما استخدمت على نحو سليم. ومن الممكن للاستخدام غير المطرد» أو 
الإسراف في استخدام أي مؤثر خحاصء» أن يؤدي إلى الارتباك وربا الإزعاج بالنسبة 
للمستفيد. ومن بين جميع الأنواع الرئيسة لنظم استرجاع المعلومات» تبدو نظم 
استرجاع الإنترنت الأكثر تعرضا للشاشات المعقدة؛ نظراً للإفراط في استعمال 


المؤثرات الخاصة» والخواص الأخرى للعرض. 
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OL LS‏ المخرجات: 


من الممكن تقديم نتائج الاسترجاع بأشكال مختلفة» ely‏ على محددات كالصيغ 
والكميات. وصيغ المخرجات في نظم الخط المباشرء هي الأكثر تنوعا؛ إذ يمكن 
للمستفيد أن يختار للمخرجات من بين صيغ محددة المعالم سلفا (كالمعلومات الوراقية 
فقطء أو المعلومات الوراقية بالإضافة إلى الممتخلصات على سبيل المثال) أو يحدد 
حقؤلا بعينها (كالمؤلف» والعنوان على سبيل المثال). وعادة ما تدعم نظم الفهارس 
المتاحة على الخط المباشر ثلاث صيغ للمخرجات؛ الصيغ الموجزة» والطويلة؛ 
وتسجيلات مارك. أما فيا يتعلق بنظم استرجاع الإنترنت» فإن خياراتها لصيغ 
المخرجات محدودة؛ نظرا لطريقة تكشيفها. وعادة ما تتكون نتائج الاسترجاع من 
الإنترنت» من العناوين والاقتباسات col)‏ الأسطر القليلة الأولى في الموقع). والجمل 
غير المكتملة هي القاعدة لا الاستثناء في مثل هذه الاقتباسات. 

وعادة ما تزود نظم استرجاع المعلومات المستفيد بوسائل مختلفة» للحصول 
على النتائج» وهي التحميل download‏ أو الطباعمة» أو البريد الإلكتروني» أو 
العرض على الشاشة. وتدل كمية المخرجات على عدد النتائج التي يتم تقديمها في كل 
مرة يتقدم فيها المستفيد بطلب. وتكفل نظم الاسترجاع على الخط المباشر للمستفيد 
بوجه عام» تحديد أي عدد من النتائج التي تسترجع للمخرجات. وفي المقابل» تتطلب 
نظم الفهارس المتاحة على الخط المباشرء من المستفيدينء بيان خياراتهم؛ بتمييز أو 
اختيار التسجيلات كل على حدة أولا. ومن المعروف تماما أن نظم استرجاع 
الإنترنت» بإمكانها إنتاج الآلاف» إن لم يكن الملايين من نتائج عملية الببحث» بسهولة. 
إلا أن المستفيد لا يمكنه عادة الحصول إلا على عشر نتائج أو عشرين» أو ثلاثين» في 
كل مرة يتقدم فيها بطلب للحصول على مخرجات. وليست هناك طريقة تكفل 
للمستفيد الحصول على جميع المخرجات على نحو فوري» إلا أن القصور الذي يكتنف 
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الحصول على نتائج البحث في الإنترنت» لا يشكل هما يذكر بالنسبة للمستفيد» نظرا 
OY‏ محرجات نظم استرجاع الإنترنت» عادة ما ترتب طبقياء وفقا لنظام تنازلي Las‏ 
للصلاحية أو الارتباط بالموضوع» وقليل من المستفيدين من يرغب فعلا في الاطلاع 
على كل نتائج عملية البحث. 

وخيارات المخرجات ليست بالعامل الحاسم في تفاعل المستفيد مع النظام, إلا 
أنه يمكن للمرونة في تقديم نتائج الاسترجاع» أن تدعم التعاطف مع المستفيد أو 
مراعاة ظروفه. وهناك تزايد في كفالة تصوير نتائج البحث بصرياء من جانب بعض. 
نظم استرجاع المعلومات؛ لمساعدة المستفيد في الحصول على نظرة تصويرية لماتم 
استرجاعه. وتبدو الفهارس المتاحة على الط المياشر (مشل: 
(aqua.queenslibrary.org‏ و نقلم استرجاع الإنترن ت(مثل: 
(www.quintura.com‏ بوجه cele‏ سائرة بخطى أسرع من نظم bat‏ المباشرء في 
عرض نتائج البحث بصرياً. كذلك يوفر عدد من نظم استرجاع المعلومات صورا 
مصغرة لأغلفة الكتب (مثل : (books.google.com‏ أو صفحات العنكبوتية (مثل: 
«(www.ask.com‏ إلى جانب نتائج البحث النصية» حتى يكون لدى المستفيد المزيد 
من المعلومات للحكم على صلاحية النتائج المسترجعة. 
مقومات المساعدة: 

تؤثر مقومات المساعدة (التوجيهية» أو التعليمية» أو البطاقات الإرشادية» على 
سبيل المثال) إلى حد بعيد في مدى تعاطف نظم استرجاع المعلومات مع المستفيد» أو 
مراعاة ظروفه. وينبغى لمقومات المساعدة أن تساعد المستفيدين فعلاء في العثور على 


إجابات لما يمكن أن يكون لدم من أسئلة» أثناء التفاعل مع نظم استرجاع 
المعلومات. وقد حدد ترنر )1989( dlas Trenner‏ ستة من مثل هذه الأسئلة» وذلك 
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في دراسة تقارن مقومات المساعدة على الخط المباشر» في ستة عشر نظاما لاسترجاع 
المعلومات: 

.١‏ فيم أخطأت آناء أو لما تلقيت رسالة الخطأ هذه؟ 

Y‏ هل أفعل آنا الشيء الصحيح؟ 

۳. أين أنا وماذا يمكن أن أفعل بعد ذلك؟ 

4. كيف أفعل شيئا ما؟ 


ه. كيف أحصل على بعض المعلومات. 

A‏ الاذا فشل النظام؟ 

ويتعلق السؤال الأول بالموقف الذي يرتكبٌ فيه المستفيد خطأ ماء أو يتلقى 
رسالة خطأ. ومن المفترض مثالياء ألا تشير مقومات المساعدة إلى الخطأ الذي حدث 
فحسب» وإن| تحدد أيضا ما يمكن عمله لتصحيح الخطأ. إلا أن معظم مقومات 
المساعدة بنظم استرجاع المعلومات» قادرة على تنفيذ الأولى» ولكنها تعجز عن تنفيذ ٠‏ 
الأخيرة. ونتيجة لذلك تترك المستفيد يتخبط بلا هدي في حيرة مرتبكا. وفيا يتعلق 
سقية الأسئلة التي سجلها ترنر )1989( »T renner‏ فإنه يمكن لعظم مقومات 
المساعدة الإجابة عن السؤالين الرابع والخامس على نحو مناسب بشكل معقول إلا 
Ll‏ تبدو ضعيفة في التعامل مع الأسئلة الثاني» والثالث والسادس. وتبدو مقومات 
المساعدة» في الوقت الراهن» قادرة بوجه عام على تسجيل المعلومات الإجرائية 
الخاصة بأنشطة الاسترجاع. وعندما Glan‏ الأمر بالأسئلة التي تتطلب توضيحاء فإن 
معظم مقومات المساعدة, في نظم استرجاع المعلومات تبدي عجزها. 

وقد اقترح الباحثون (راجع على سبيل Shneiderman & Plaisant, JUL!‏ 
Trenner, 1989‏ ;2005( إرشادات لتصميم مقومات المساعدة J‏ النظم 
الإلكترونية» با في ذلك نظم استرجاع المعلومات. ومن وجهة نظر المستفيد. OLS‏ 
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مقومات المساعدة المناسبة ينبغي أن تكون قادرة على توفير الإجابات لأسئلة 
المستفيدين» وليس مجرد تقديم بعض البيانات التي يتم تزويد النظام بها سلفا. وينبغي 
أن تكون الإجابات أيضا خالية من المصطلحات المتخصصة. واللغة التي تنم عن 
التحدي أو التهديد (مثل ””لقد تم تنفيذ عملية غير قانونية“) Oly‏ تكون هذه المقومات 
متاحة طوال الوقت» وللمستفيدين على اختلاف مستوياتهم؛ فالمستفيدون يلتمسون 
المساعدة من نظم استرجاع المعلومات عندما يحتاجون إليهاء وإذا عجزت مقومات 
المساعدة عن تلبية احتياجات المستفيدين» OP‏ وظيفة نظم استرجاع المعلومات ذاتها 
قد لا تتحقق» وناهيك عن قضية التعاطف مع المستفيد أو مراعاة ظروفه. | 
تقييم تفاعل 1 لمستفيد مع النظام: 

التعاطف مع المستفيد أو مراعاة ظروفه» معيار عريض لتقييم تفاعل المستفيد 
مع النظام. وقد تطورت مقاييس أكثر تحديدا (راجع على سبيل JL‏ 
(Shneidermann & Plaisant, 2005‏ للهدف نفسه. 
الوقت اللازم لتعلم المستفيد مهام استرجاع محددة: 

يحدث التعلم am‏ يتفاعل المستفيد مع نظام ما لاسترجاع المعلومات؛ أي أن 
المستفيدين بحاجة OY‏ يتعلموا كيف يتعاملون مع نظام ما لاسترجاع المعلومات» قبل 
إجراء عمليات البحث فعلا. وتنعكس سهولة التعلم على الوقت اللازم لاكتساب 
التعلم قصيراء كان نظام استرجاع المعلومات أفضلء فيا يتعلق بتعاطفه مع المستفيد. 
ولا يوفر النظام غير الودي بيئة مريحة يمكن فيها للمستفيد أن يتعلم. 
ا 

كم يستغرق تلقي المستفيد للتلقيم المرتد من نظام استرجاع المعلومات» أثناء 
التفاعل؟ 5 (IS‏ طال ما تستغرقه العملية من وقت» يصبح النظام أقل تعاطفامع 
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المستفيد. وكا ذهبت شنيدرمان وبليزانت Shneiderman and Plaisant‏ 
)2005(« فإن زمن الاستجابة بالنسبة للمهام المألوفة» ينبغي أن يكون ما بين ثانيتين 
وأربع ثوانِ» ويمكن لوقت انتظار أطول من خمس عشرة ثانية أن يكون غير إيجابي 
بالمرة. وعلى الرغم من أن مؤشرات أزمنة الاستجابة code‏ تتعلق بالتفاعل بوجه sple‏ 
فإنها يمكن أن تنطبق ولاشك على بيئة استرجاع المعلومات. ويتقرر هذا المعيار» في 
الأساسء تبعأ للقدرة التجهيزية لنظام استرجاع المعلومات. وعادة ما تكفل وحدات 
التجهيز القوية سرعة تفاعل عالية. 
معدل أخطاء المستفيد: 

إذا كان نظام استرجاع المعلومات حدسياء ويفسر نفسه ذاتياء فإن المستفيدين 
يرتكبون قليلاً من الأخطاء في التفاعل معه. ومالم يكن الأمر كذلك فإن الأخطاء لا 
مفر منها (كاللجوء إلى خيار خاطئ على سبيل المثال). وبذلك يصبح عدد الأخطاء 
التي يقع فيها المستفيد» أثناء عملية الاسترجاع» مقياسا آخر للحكم على مدى تعاطف 
نظام استرجاع المعلومات مع المستفيد. ويمكن لمقومات المساعدة التي سبق أن 
ناقشناهاء أن تنهض بدور مهم» في الحد من معدل الأخطاء. ومن الطبيعي أن يقع 
المستفيدون في أخطاء أقل» إذا ما توافرت المساعدة لهم عندما تدعو الحاجة إليهاء إذا 
ما كانت عملية التفاعل شفافة بالنسبة لهم. 
القدرة على التذكر بمرور الوقت: 

تستلزم إجراءات التفاعل» وخصوصا في أسلوب لغة إصدار الأوامر» أن يتم 
تعلمها والتمرس cle‏ لكي يتحقق التمكن منها. ويعد الاحتفاظ ببذه المهارات لفترة 
زمنية» تقيبياً لمدى تعاطف نظم استرجاع المعلومات مع المستفيدين» من زاوية أخرى 
مختلفة؛ فمن الممكن على سبيل SLE‏ للغة إصدار الأوامر أن تكون من السهل 
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تذكرهاء إذا كانت الأوامر قابلة SHU‏ وتتسم col LVL‏ كأن يستعمل أمر الطبع كلمة 
print‏ بدلا من prt‏ أو ctype‏ أو أي شىء آخر. ومن OLS‏ واجهة التعامل المتعاطفة 
نظرا للتعزيز الإيجابي» أن تمكن المستفيدين من الاحتفاظ بما يعرفونه حول النظام» 
لوقت أطول مما تكفله الواجهة غير المتعاطفة. 


رضاء المستفيد: 


وهذا المقياس لمدى تعاطف النظام ذاتي أو غير موضوعي؛ نظرا لأنه من 
الصعب تقييم الرضاء بطريقة موضوعية» حتى وإن كان من الممكن التعبير عن 
الرضاء كميا ببعض الطرق (مثل عدد النتائج المسترجعة)ء إلا أن هذا المعيار ينبغي 
وضعه في الحسبان في تقييم الجانب النوعي في تفاعل المستفيد مع النظام؛ فكيف يمكن 
على سبيل SU‏ أن يشعر المستفيد تجاه التفاعل؟ ويصنف بعض الباحثين (راجع 
Hildereth, 1‏ على سبيل المثال) رضاء المستفيد, إلى الرضاء المادي (أي التنائج 
التي يتم الحصول عليها من التفاعل مع نظام استرجاع المعلومات)» أو الرضاء 
العاطفي (أي الإحساس بالإنجاز الناتج عن التفاعل). Sy‏ كان التفاعل بوجه عام 
أكثر تعاطفاء أصبح المستفيد أكثر رضاءً. 

إلا أن هناك مواءمات لا مفر منهاء بين المعايير الخمسة التي تناولناها توا 
(Shneiderman &Plaisant, 2005)‏ ونادرا ما يبلغ أي تفاعل بين المستفيد 
والنظام قمة الأداء» في كل الجوانب. وينبغي دائا أن يوضع المستفيد في الحسبان؛ نظرا 
OY‏ جميع أنشطة استرجاع المعلومات تدور في فلك المستفيد» لا في فلك النظام. 

des‏ الرغم من أنه لا يزال هناك الكثير ما ينبغي توافره في تفاعل المستفيد مع 
النظام» فإن الموقف قد تحسن ولاشكء إذ تم اكتساب المزيد من الخبرات في تلبية 
متطلبات المستفيد )1999 (Large et al.,‏ فمن أسلوب لغة إصدار الأوامرء إلى 
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الأسلوب الحجين للتفاعل» ومن العرض أحادي اللون إلى التطبيق الفني لمختلف 
الخصائص» ومن رسائل المساعدة المحملة بالمصطلحات التقنية» إلى البطاقات 
الإرشادية IJE‏ من المصطلحات التخصصية» أصبح تفاعل المستفيد مع النظام أكثر 
تعاطفا مع المستفيد اليوم» ke‏ كان عليه في الماضي . 


المستفيد واسترجاع المعلومات في العصر الرقمي: 

تؤدي التقنيات الرقمية ولاشك. إلى الارتفاع بمستوى كفاءة أنشطة استرجاع * 
المعلومات. كذلك تثير هذه التقنيات بعض المخاوف والقضايا للمستفيد» وخصوصا 
المبتدئ» فاسترجاع المعلومات يعتمد على سبيل المثال؛ في العصر الرقمي» على 
التقنيات الرقمية؛ التي يمكن أن تسبب القلق والاغتراب للمستفيد؛ فقد لا يشعر كل 
مستفيد بالراحة عند إجراء عمليات البحث في نظام إلكتروني. ونظرا لما يكتنف النظم 
الراهنة لاسترجاع المعلومات من قصور» فإن المستفيد قد يشعر بالقلق أو عدم 
الاطمئنان عندما يحاول استرجاع المعلومات في البيئة الرقمية. يضاف إلى ذلك» 
الحاجة إلى تجهيزات متخصصة» لاسترجاع المعلومات رقميا. وم يعد ههج القلم 
الرصاص والورق» في البحث عن المعلومات يدوياء في البيئة الورقية» يعمل بكفاءة في 
العصر الرقمي. 

وفضلا عن ذلك» فإن نظم استرجاع المعلومات» في العصر الرقمي» يتم 
تطويرها باستمرار» أو يتم إدخال نظم جديدة. وقد يكون على المستفيد أن يتعلم أو 
يدرب على أساس منتظم» لمتابعة التغيرات» التي تضيف أعباء جديدة لخطط عمل 
المستفيد المثقلة فعلا. وبعبارة أخرى» فإن استر جاع المعلومات في العصر الرقمي 
يمكن أن تكون له آثار جانبية بالنسبة للمستفيد؛ نظرا لعامل التقنيات. 
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وبالإضافة إلى عامل التقنيات» يتعين معاملة المستفيدين من نظم المعلومات 
المختلفة» على نحو مختلف؛ نظرا لأنمم عادة ما تكون لديم خيرات استرجاع 
Ole gles‏ ختلفة؛ فالمستفيدون من نظم الخط المباشرء على سبيل JEU‏ إما أن يكونوا 
اختصاصيو معلومات» يقومون بدور الوسيط» أو مستفيدون نهائيون تلقوا تدريبا 
مناسبا. وني مقابل ذلك» فإن المستفيدين من نظم استرجاع الإنترنت» قلم| يكون قد 
توافر لهم التدريب في استرجاع المعلومات. ومن ثم» فإن بعد المستفيد أو ما يتعلق 
بالمستفيد يصبح متزايد الثنوع بالنسبة لاسترجاع المعلومات في العصر الرقمي. 

وعلى الرغم من أن تنظيم المعلومات في العصر الرقمي» قد لا يكون له ما 
لاسترجاع المعلومات من تأثير عن المستفيدء فإن SE‏ التقنيات الرقمية في هذا المجال» 
لا يمكن تجاهله بحال. وما يجعل التأثير أقل وضوحاء هو أن من يقومون بتنظيم 
المعلومات». dole‏ ما يكونون اختصاصيي معلومات» تكيفوا مع إيقاع العصر الرقمي» 
وسرعته عن طريق تدريبهم وتمرسهم. 


405 


المراجع 


Allen, Thomas. (1970). Communication networks in R & D 
laboratories. R & D Management, 1. Reprinted in Belver C. 
Griffith (Ed.) Key papers in information science (pp. 66-73). White 
plains, NY: Knowledge Industry Publications. 


Bates, Marcia J. (1989). The design of browsing and berrypicking 
techniques for the online searching interface. Online Review, 13 
(5), 407-424. 


Belkin, Nicholas J., et al. (1995). Cases, scripts and information 
seeking strategies: On the design of interactive information 
retrieval systems. Expert Systems With Applications, 9(3), 379-395. 


Belkin, Nicholas J., Oddy, Robert N., and Brooks, Helen M. (1982). 
ASK for information retrieval. Part I. Background and theory. 
Journal of Documentation, 38(2), 61-71. 


Borgman, Christine L. (1989). All users of information retrieval 
systems are not created equal: An exploration into individual 
differences. Information Processing & Management, 25(3), 237- 
251. 


Buente, Wayne, and Robbin, Alice. (2008). Trends in internet 
information behavior. 2000-2004. Journal of the American Society 
for Information Science and Technology, 59(11), 1743-1760. 


Byström, Katriina, and Järvelin, Kalervo. (1995). Task complexity 
affects information seeking and use. Information Processing & 
Management, 31(2), 191-213. 


Case, Donald O. (2006). Information behavior. Annual Review of 
Information Science and Technology, 40, 293-327. 


406 


Case, Donald O. (2007). Looking for information: A survey of research on 
information seeking, needs, and behavior. 2nd ed. Boston: Academic 
Press. 


Chowdhury, Gobinda G. (1999). Introduction to modern information 
retrieval. London: Library Association Publishing. 


Co, Elise, and Pashenkov, Nikita. (2008). Emerging display 
technologies for organic user interfaces. Communications of the 
ACM, 51(6), 45-47. 


Crane, Diane. (1972). Invisible colleges: Diffusion of knowledge in 
Scientific communities. Chicago: University of Chicago Press. 


Dervin, Brenda (1992). From the mind's eye of the user: The sense- 
making qualitative-quantitative methodology. In Jack D. Glazier 
and Ronald R. Powell (Eds.), Qualitative Research in Information 
Management (pp. 61-84). Englewood, CO: Libraries Unlimited. 


Ellis, David. (1989). A behavioural approach to information retrieval 
design. Journal of Documentation, 45(3), 171-212. 


Faroog, Umer, et al. (2007). Evaluating tagging behavior in social 
bookmarking systems: Metrics and design heuristics. Proceedings 
of the ACM Conference.on Supporting Group Work (pp. 351-360). 
New York: Association of Computing Machinery. 


Fenichel, Carol H. (1981). Online searching: Measures that 
discriminate among users with different types of experiences. 
Journal of the American Society for Information Science, 32, 23- 
32. 


Frants, Valery I, and Brush, Craig B. (1988). The need for 
information and some aspects of information retrieval systems 
construction. Journal of the American Society for Information 
Science, 39(2), 86-91. 


407 


Galitz, Wilbert O. (1997). Essential guide to user interface design: An 
introduction to GUI design: Principles and techniques. New York: 
John Wiley & Sons. 


Gorman, Paul, et al. (2002). Following experts at work in their own 
information spaces: Using observational methods to develop tools 
for the digital library. Journal of the American Society for 
Information Science and Technology, 53(14), 1245-1250. 


Hildreth, Charles. (2001). Accounting for users’ inflated assessments 

of online catalog search performance and . usefulness: An 

“experimental study. Information Research, 6(2). Retrieved January 
21, 2009, from informationr.net/ir/6-2/paperl01.html 


Huotari, Maija-Leena, and Chatman, Elfreda. (2001). Using everyday 
life information seeking to explain organizational behavior. Library 
& Information Science Research, 23(4), 351-366. 


Ingwersen, Peter. (1982). Séarch procedures in the library analyzed 
from the cognitive point of view. Journal of Documentation, 
38,165-191. 


Ingwersen, Peter. (1992). Information retrieval interaction. London: 
Taylor Graham. 


Ingwersen, Peter. (1996). Cognitive perspectives of information 
retrieval interaction: Elements of a cognitive IR theory. Journal of 
Documentation, 52(1), 3-50. 


Ingwersen, Peter, and Jarvelin, Kalervo. (2005). The turn: Integrating 
of information seeking and retrieval in context. Dordrecht, The 
Netherlands: Springer. 


Jarvelin, Kalervo, and Wilson, Tom D. (2003). On conceptual models 
for information seeking and retrieval research. Information 
Research, 9(1), paper 163. Retrieved December 20, 2008, from 
informationr.net/ir/9-I/ paperl63.html 


408 


Julien, Heidi, and Duggan, Lawrence J. (2000). A longitudinal 
analysis of the information needs and uses literature. Library & 
Information Science Research, 22 (3), 291-309. 


Kipp, Margaret E. I., and Campbell, D. Grant. (2006). Patterns and 
inconsistencies in collaborative tagging systems: An examination 
of tagging practices. Proceedings of the Annual Meeting of the 
American Society for Information Science and Technology, 43. 
[CD-ROM]. Retrieved January 5, 2009, from 
dlist.sir.arizona.edu/1704/ 01/KippCampbellASIST.pdf . 


Komlodi, Anita, Soergel, Dagobert, and Marchionini, Gary. (2006). 
Search histories for user support in user interfaces. Journal of the 
American Society for Information Science and Technology, 57(6), 
803-807. 1 


Kuhlthau, Carol C. (1993). Seeking information: A process approach 
to library and information services. Norwood, NJ: Alblex. 


Lancaster, F. W., and Warner, Amy J. (1993). Information retrieval 
today. Arlington, VA: Information Resources Press. 


Large, Andrew, Tedd, Lucy A., and Hartley, R. J. (1999). 
Information seeking in the online age: Principles and practice. 
London: Bowker-Saur. 


Marchionini, Gary, et al. (1993). Information seeking in full-text end- 
user-oriented search systems: The roles of domain and search 
expertise. Library & Information Science Research, 15,35-69. 


Miller, George A. (1956). The magical number seven plus or minus 
two: Some limits on our capacity for processing information. 
Psychological Review, 63, 81-97. 


Paisley, William J. (1968). Information needs and uses. Annual 
Review of Information Science and Technology, 3,1-30. 


409 


Parkes, Amanda, Poupyrev, Ivan, and Ishii, Hiroshi. (2008). 
Designing kinetic interactions for organic user interfaces. 
Communications of the ACM, 51(6), 58-65. 


Pettigrew, Karen E., Fidel, Raya, and Bruce, Harry. (2001). 
Conceptual frameworks in information behavior. Annual Review of 
Information Science and Technology, 35, 43-78. 


Pirolli, Peter, and Card, Stuart K. (1999). Information foraging. 
Psychological Review, 106(4), 643-675. 


Price, Derek J. de Solla. (1963). Little science, big science. New 
York: Columbia University Press. 


Rekimoto, Jun. (2008). Organic interaction technologies: From stone 
to skin. Communications of the ACM, 51(6), 38-44. 


Resnick, Marc L., and Vaughan, Misha W. (2006). Best interface and 
future visions for search user interfaces. Journal of the American 
Society for Information Science and Technology, 57(6), 781-787. 


Rogers, Yvonne. (2004). New theoretical approaches for human- 
computer interaction. Annual Review of Information Science and 
Technology, 38, 87-143. 


Rose, Daniel E. (2006). Reconciling information-seeking behavior 
with search user interfaces for the web. Journal of the American 
Society for Information Science and Technology, 57(6), 797-799. 


Rowlands, lan, et al. (2008). The Google generation: The information 
behaviour of the researcher of the future. ASLIB Proceedings, 
60(4), 290-310. 


Shaw, Debora. (1991). The human-computer interface for 
information retrieval. Annual Review of Information Science and 
Technology, 26, 155-195. 


Shneiderman, Ben, and Plaisant, Catherine. (2005). Designing the 
user interface: Strategies for effective human-computer 
interaction. 4th ed. Boston: Addison-Wesley. 


410 


Soukhanov, Anne H., et al. (Eds.). (1984). Webster's II new Riverside 
university dictionary. Boston: Riverside Publishing Co. 


Spink, Amanda, and Cole, Charles. (2006). Human information 
behavior: Integrating diverse approaches and information use. 
Journal of the American Society for Information Science and 
Technology, 57(1), 25-35. 


Trenner, L. (1989). A comparative survey of the friendliness of online 
"help" in interactive information retrieval systems. Information 
Processing & Management, 25(2), 119-136. 


Vertegaal, Roel, and Poupyrev, Ivan. (2008). Organic user interfaces. 
Communications of the ACM, 51(6), 26-30. 


Wilson, Tom D. (1999). Models of information behaviour research. 
Journal of Documentation, 55(3), 249-270. 


Wilson, Tom D. (2008). The information user: Past, present and 
future. Journal of Information Science, 34(4), 457-464. 


Zhang, Xiangmin, and Chignell, Mark. (2001). Assessment of the 
effects of user characteristics on mental models of information 
retrieval systems. Journal of the American Society for Information 
Science and Technology, 52(6), 445-459. 


411 


- الفصل الحادي عشر 
تقييم تنظيم المعلومات واسترجاعها 


الآن» وقد ناقشنا مختلف جوانب ومكونات تنظيم المعلومات واسترجاعهاء 
حان الوقت لتقييم هذه الأنشطة المترابطة. وقد فصّل كثير من الباحثين (راجع» 
Keen, 1971; Large, Tedd & Hartley, 1999; Swanson R.W., 1978‏ 
على سبيل المثال) القول في الحاجة إلى تقييم تنظيم المعلومات واسترجاعها. ونأمل في 
الارتقاء بمستوى الأداء في هذه الأنشطةء عندما يتم التحقق من مظاهر ضعف نظم 
استرجاع المعلومات» ثم التخلص من هذه المظاهر في النهاية» نتيجة لعملية التقييم. 

وتقييم تنظيم المعلومات واسترجاعهاء موضوع ht‏ باهتام كثير جدا من 
الباحثين في المجال» وذلك على مدى أكثر من خمسين عاماء إلا أن هناك كثيرا من 
الجدل حول مقاييس التقييم وطرقه. وسوف نناقش في هذا الفصل ثلاثة موضوعات 
رئيسة: )١(‏ مقايبس التقييم (كالتحقيق precision‏ والاستدعاء recall‏ على سبيل 
(tel!‏ لأداء تنظيم المعلومات واسترجاعهاء (Y)‏ معايير التقييم بالنسبة لمختلف أنواع 
نظم استرجاع المعلومات» بها في ذلك نبذة عن القابلية للإفادة» (Y)‏ مشروعان كبيران 
لتقيبم تنظيم المعلومات واسترجاعهاء هما اختبارات أو تجارب كرانفيلد Cranfield‏ 
وسلسلة مؤتمرات استرجاع النصوص )3 )4 Text REtrieval (Trec‏ 
Conference‏ ونتناول قضية طرق التقييم» بالإضافة إلى التجارب الكبرى 
في المجال. 
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مقاييس تقييم تنظيم المعلومات واسترجاعها: 

تطورت مقاييس كثيرة لتقييم تنظيم المعلومات واسترجاعها. ومن أجل 
الوضوح نناقش مقاييس تقييم تنظيم المعلومات» بمعزل عن مقاييس تقييم 
استرجاع المعلومات. 


مقاییس تقيبيم تيد تنظيم المعلومات: 

كما by‏ في الفصلين الثاني والثالث» يمكن للمعلومات أن تنظم بطرق متنوعية. 
والتكشيف. والتقسيم إلى فئات» أي التصنيف» والتلخيص» بعض الأشكال الرئيسة ' 
لتنظيم المعلومات. وعلى الرغم من أن لكل شكل من أشكال تنظيم المعلومات 
خصائصه التي تميزه» فإنه قد قصد بكل هذه الأشكال مجتمعة؛ إبراز جوهر 
المعلومات» وجعل المعلومات قابلة للاسترجاع فيا بعد ومن ثم فإن مجموعة مشتركة 
من معايير التقييم GEV US)‏ والاطراد» والموضوعية)» يمكن أن تطبق على 
كل أنواع طرق تنظيم المعلومات. 
الدقة: 

الدقة accuracy‏ هي أهم مقياس في تقييم جودة تنظيم المعلومات؛ نظرا لأن 
التنظيم المشوه للوثائق الأصليةء يمكن أن يضيع المغزى الكامل لتنظيمها. وتعني 
الدقة أن يمثل التنظيم محتوى الوثائق الأصلية بدقة. ويمكن للاختزال في التنظيم أن 
يحدث فيا يتعلق با لحجم» وليس في يتعلق بالمحتوى أو المضمون. وينبغي وضع الدقة 
في الحسبان أيضاء في الاستشهاد المرجعى citation‏ والحجاء على سبيل المثال. 

والتحديد أو التخصيص specificity‏ مقهوم وثيق الصلة ABL‏ وعادة ما 
يستخدم لقياس جودة التكشيف. ويعني التحديد؛ بحكم التعريف. المدى الذي يتم 
به التحقق من مفهوم ما أو موضوع ما في وثيقة ماء بمصطلح دقيق في سلم أو هرم 
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علاقات الجنس والنوع الخاصة به )1995 (Wellisch,‏ ففي هر م استر جاع 
Le shall‏ استرجاع الوسائط المتعددة ”استرجاع الفيديو” information‏ 
«retrieval-multimedia retrieval-video retrieval‏ يتم تعيين المصطلح 
”استرجاع الفيديو" للوثيقة التي تتناول الموضوع» لضمان أعلى درجات التخصيص في 
التكشيف. أما المصطلحان الآخران في الهرم» فأدنى درجة في التخصيص. ويتحدد 
التخصيص بلغة التكشيف (أي اللغة المقيدة أو اللغة الطبيعية) المستخدمة. 
وتكفل اللغة الطبيعية للمزء بوجه عام» القدرة على تحقيق درجة عالية من التخصيص 
الإيجاز: 

من بين أهداف تنظيم المعلومات» مساعدة المستفيدين على الاقتصاد في الوقت 
والجهد. في الحصول على ما يحتاجون إليه من معلومات. وتفجر المعلومات إحدى 
العبارات التي تم سكها لوصف الكميات الهائلة من ا معلومات» التي يتعين على 
المستفيدين التعامل معها. ومن ناحية أخرى. فإنه من الحقائق التي لا يمكن إنكارهاء 
أن الأمر يتطلب من المستفيد, لمراجعة ناتج تنظيم المعلومات (كالمستخلصات» 
والملخصات» ومصطلحات التكشيف على سبيل المثال) وقتا أقصر بكثير مما يتطلبه 
الاطلاع على وثيقة أصلية؛ ومن ثم فإن الإيجاز يصبح مقياسا رئيساء للحكم على ما 
إذا كان هدف الاقتصاد في الوقت والجهد قد تحقق فعلا أم لا. 

وقد تم إقرار معايير معينة لمختلف أشكال تنظيم المعلومات (راجع» 
Lancaster, 1998‏ على سبيل المشال) فيم| يتعلق بالإيجاز؛ فبالنسبة لمقالاات 
الدوريات» على سبيل المثال» عادة ما يتم تعيين ما بين خمسة مصطلحات تكشيف 
وعشرة» وإعداد مستخلص من ۲٠١‏ كلمة أو أقل. وإذا ما كان ناتج التنظيم يتخذ 
AY glee WSS‏ فإنه قلا يكفل مساعدة المستفيدين على التذكر» من أجل الحد من وقتهم 
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المستنفد في استرجاع المعلومات. ومن الممكن معاملة الشمول exhaustivity‏ في 
التكشيف بوصفه مصطلحا يتصل بالإيجاز. وقد عرفت ولش )1995( Wellisch‏ 
الشمول بوصفه المدى الذي يتم به جعل المفاهيم والموضوعات LLG‏ للاسترجاع» 
بواسطة مصطلحات التكشيف. ويتحدد الشمول بناء على سياسة التكشيف 
المتبعة في النظام. 


الاطراد: 

من الممكن معالجحة الوثيقة الواحدة بعدة أشكال (كالتكشيف والاستخلاص 
على سبيل المثال) ومن جانب عدة أشخاص. كما أنه من المألوف أيضا أن نرى مطبوعا 
ما (دورية على:سبيل المثال) مكشفا من جانب خدمات تكشيف abe‏ فمجلة 
Journal of the American Society for Information Science and‏ 
Technology‏ على سبيل SL‏ تكشّف في «Chemical Abstracts‏ و 
Computer Literature Index‏ وعشرة مراصد pl‏ ی لخدمات الاستخلاص 
والتكشيف. وعندما يطبق هذا الأسلوب للمعالجحة المتعددة للمعلومات» الذي اقترحه 
إنجورسن )1996( 10876565 فإن الناتج النهائي يمكن أن يكون غير مطرد في 
التغطية والأسلوب. وقد تبين من دراسات التكشيف» أن المستوى المرتفع للاطراد 
consistency‏ من الصعب Oly cae gl‏ اطراد التكشيف يتراوح بين ٠١‏ با ئة و٠8‏ 
بالمئة (ر اجع على سبيل .(Hooper, 1965 JUI‏ وقد سجل كلفردون Cleverdon‏ 
)1984( أنه عندما كشف مكشفان متمرسان الوثيقة نفسهاء باستخدام اللغة المقيدة 
نفسهاء كانت نسبة المصطلحات المشتركة فيه بينهم| LL ٠١‏ فقط. ومن الممكن لتنظيم 
المعلومات» في العصر الرقمي» بفضل الأساليب الآلية» أن يحقق نظريا اطرادا أفضل» 
إلا أن البحوث التجريبية في هذا المجالء لم يتم إجراؤها بعد. 
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ولا يعني ol bY‏ ضمنا مجرد مضاهاة dels‏ بكلمة»ء وإنما يدل على Attell‏ 
الموحدة (كاللغة وعمق التغطية على سبيل (JEU‏ لجوهر الوثائق الأصلية» بصرف 
النظر عن شكل التنظيم» والشخص الذي يقوم بالتنظيم. ويمكن للاطراد أن يؤثر في 
جودة التنظيم» وأداء الاسترجاع في النهاية أيضا. 


الموضوعية: 

تشكل الموضوعية objectivity‏ معيارا آخر للتقييم بالنسبة لتنظيم المعلومات؛ 
نظرا OY‏ الذاتية subjectivity‏ والتفسيرات الشخصية؛ يمكن أن تظهئر في أثناء 
عملية التنظيم. وينبغي لتنظيم المعلومات أن يكون توصيفا موثوقا به للوثيقة 
الأصلية» بدون أي تغيير ني محتواها. ومن المهم أيضا ألا يتم إسباغ أو إضفاء 
الأفضليات الشخصية للمرء على التنظيم. وبمزيد من التحديد, فإن أي تعزيز لأفكار 
المؤلف» أو الإقحام المتعمد لاتجاهات المكشف» أو اختيار مصطلحات تعبر ضمنا عن 
الاتجاهات, أو تجاهل أو إهمال أفكار وردت ABS JL‏ ف الكشاف» ينال فعلاً من 
موضوعية تنظيم المعلومات )1991 (Bell,‏ فالتنظيم ا حسم بالذاتية لا يعبر عن 
الصورة الحقيقية للوثائق الأصلية. 
الوضوح» والقابلية للقراءة, والقابلية للإفادة: 

بالإضافة إلى المقاييس التي تناولناها تواء طرحت معايير أخرى لتقييم تنظيم 
المعلومات. والوضوح clarity‏ والقابلية للقراءة أو الانقرائية readability‏ 
والقابلية للإفادة أو الاستخدام cusability‏ من بين هذه المعايير. وتحاول كل هذه 
المقاييس إبداء التعاطف مع المستفيد أو تيسير مهمته user friendliness‏ وجعل 
المستفيدين يشعرون بالراحة أكثر» عندما يتعاملون مع ناتج تنظيم المعلومات. 
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ومقاييس التقييم بالنسبة لتنظيم ا معلومات» أقل من تلك الخاصة باسترجاع 
المعلومات» LS‏ أن هذا الضرب من التقييم لا يميز أيضا عملينة التنظيم عن أداء 
التنظيم. وإذا أردنا الدقة» فإن جودة التنظيم لا يمكن أن تقيم فعلاء مالم يستعمل 
ناتج التنظيم في استرجاع المعلومات. وفي الوقت نفسه. تتوقف جودة استرجاع 
المعلومات على جودة تنظيم المعلومات. فالتنظيم الجيد للمعلومات» ينهض بدور لا 
غنى عنه في ضمان أداء الاسترجاع ttl‏ ولا يمكن إلا من خلال استرجاع المعلومات 
الحكم في النهاية على جودة تنظيم المعلومات. 


مقايبس تقييم استرجاع المعلومات: 

بالمقارنة بتنظيم المعلومات» حظى استرجاع المعلومات بقدر كبير جدامن 
الاهتمام» من جانب الباحثين» فيا يتعلق بمقاييس التقييم» ويرجع ذلك جزئيا إلى أن 
الأول مجرد شرط أساس للأخير. وكا سبق أن ذكرناء فإن جودة التنظيم لا يمكن 
تقييمها فعلا إلا عندما يستعمل ناتج التنظيم في الاسترجاع. واسترجاع المعلومات 
نشاط يركز على الأداء» كا يركز على العملية في الوقت نفسه» على الرغم من أن البشرء 
وخصوصا المستفيدين النهائيين» عادة ما يبدون اهتماما با يتم استرجاعه؛ أكثر مما 
مهتمون با يتم فعلا أثناء عملية الاسترجاع. إلا أنه يمكن للفهم الأفضل لعملية 
الاسترجاع» أن يؤدي إلى الارتفاع بمستوى أداء الاسترجاع. ولهذاالسبب» فإن 
مقاييس التقييم التي تطورت لاسترجاع المعلومات» يمكن تقسيمها تقريبا إلى نوعين؛ 
Loy‏ يركز على الأداء» ويركز الآخر على العملية. ونناقش النوع الأول من المقاييس في 
١0م lew Y‏ تحظى مقاييس تقييم عملية الاسترجاع» أو نظام استرجاع المعلومات 
برمته» بالاهتمام في ۲/۱۱. ومن بين مقاييس تقييم أداء الاسترجاع» يعد الاستدعاء 
والتحقيق أشهر معيارين» وهما الأوسع مدى في الاستخدام )1992 (Salton,‏ 
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الاستدعاء والتحقيق: 

يقدم الجدول رقم ١/1١‏ جميع etl cll‏ المحتملة بالنسبة للهمة الاسترجاع» 
باستعمال الرموز والمصطلحات التي عادة ما نجدها في الوثائق التي تتناول استرجاع 
المعلومات. فالتسديدات hits‏ على سبيل المثال» تعني الوثائق المسترجعة الصالحة أو 
المرتبطة بالموضوع relevant‏ وتعرف الاخفاقات "misses"‏ بنا الوثائق الصالحة 
التي لم تسترجع. وبناء على نتائج الاسترجاع المحتملة هذه» أمكن اشتقاق مقاييس 
تقييم متنوعة. والاستدعاء والتحقيق» اللذان اقترحها في البداية كنت وزملاؤه Kent‏ 
«and his colleagues (1955) |‏ كمعامل الصلاحية spertinency factor‏ ومعامل 
الاستدعاء recall factor‏ اثنان من مثل هذه المقاييس. 


الجدول رقم ١/١١‏ نتائج الاسترجاع المحتملة 








+ ب + ج + د 


JS)‏ ما ف النظام) 








419 


وكا تبين لنا في 0/ Y/Y‏ فإن الاستدعاء GR)‏ المعادلات التالية) يعرف 
بوصفه نسبة عدد الوثائق المتصلة بالموضوع المسترجعة إلى إجمالى عدد الوثائق المتصلة 
بالموضوع في النظام. وباستعمال الرموز الواردة في الجدول رقم /١١‏ ١ء‏ يمكن صياغة 
المعادلة التالية: 
/j=R‏ )1+ >( 


وبناء على ذلك فإن التحقيق (P)‏ هو نسبة عدد الوثائق المدصلة با موضوع 

المسترجعة» إلى إجمالى عدد الوثائق المسترجعة من النظام: . 
fi=P‏ «أ+جب) 
وتميل العلاقة بين الاستدعاء والتحقيق لأن تكون تناسبا عكسيا (راجع على 

سبيل «(Lancaster & Warner, 1993 JUI‏ وإن كان Fugmann (1993) Leb‏ ` 
قد دحض تلك العبارة بعدة أمثلة؛ فقد تبين OLAW‏ أن الزيادة في التحقيق ليس من 
الضروري أن 555 0 مصحوبة ae‏ مقابل في الاستدعاء» serie de Oly‏ 
لا يمكن بحال القول بأنها يترتب عليها دائ تناقص في التحقيق. والتفسير الحزئي للنتيجة 
ادي امي هاا عاد عدر ان T‏ الفط بز E‏ 
الاستدعاء والتحقيقء بينم| يؤثر استرجاع الوثائق غير الصا حة في التحقيق فقط 
.(Korfhage, 1997)‏ 

ومن المفترض أن يقيس الاستدعاء القابلية للاسترجاع الخاصة بنظام استرجاع 
المعلومات» بين) ينبغي أن يقيم التحقيق قدرة نظام استرجاع المعلومات على فصل غير 
الصالح عن الصالح. إلا أن هناك عقبتين رئيستين OEE‏ حجر عثرة في حساب هذين 
المقياسين؛ أولاهماء كيف يمكن تعريف الصلاحية وقياسها؟ والثانية كيف يمكن 
التعرف على إجالى عدد الوثائق الصا حة في النظام؟ 
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مفهوم الصلاحية: 

لقد كان النقاش» وبمزيد من الدقة الجدل. حول معنى الصلاحية طؤيلا 
ومحتدما. وقد قدم ميزارو )1997( Mizzaro‏ تاريخا للصلاحية؛ بمراجعة حوالي 
٠‏ بحثاء نشرت عن الموضوع» منذ ما قبل خمسينيات القرن العشرين» حتى 
منتصف تسعينيات القرن نفسه. وعلى الرغم من ذلك حظي الأمر بقدر كبير من 
الاهتام» ولم يتم الاتفاق حول سبل تعريف الصلاحية» وكيف يمكن قياسها ببساطة؛ 
نظرا OF‏ الصلاحية» في جوهرها حكم ذاتي» متأثر بكثير من العوامل المترابطة؛ 
فالصلاحية كالحب» إحساس في نظر من يرى. وهي مفهوم لا يمكن وصفه صراحة 
أو التعبير عنه كميا بسهولة. 

وعلى الرغم من ذلكء تم اقتراح عدد ضخم من التعريفات للصلاحية. وقد 
تتبع ساراسفك )1975( Saracevic‏ وحلل ولخص كثيرا من التعريفات المتوافرة 
للصلاحيةء وخلص إلى أن فهمنا للصلاحية قد أصبح أفضل بكثير» وأوضح وأعمق 
وأوسع ما كان عليه في أعقاب الحرب العالمية الثانية مباشرة. إلا أن الشوط لا يزال 
طويلا. وقد أعاد شامبر› io jalg‏ ونيلان Schamber, Eisenberg and Nilan‏ 
)1990( النظر في قضية تعريف الصلاحية» وأشاروا إلى أنه لم يتم التوصل بعد إلى 
اتفاق فيم| يتعلق بالتعريف. وكان في اعتقاد هؤلاء الباحثين» أن الصلاحية مفهوم 
متعدد الأبعاد. يتوقف على عوامل داخلية وخارجية. كا يستند هذا المفهوم أيضا إلى 
عملية إبداء رأي بشرية ديناميكية. ومن الممكن» على وجه التحديد, التخقق من CIS‏ 
عاملا مؤثرا في أحكام الصلاحية» وتصنف هذه العوامل في ست فئات: من يصدرون 
الأحكام»ء والطلبات» والوثائق» ونظم استرجاع المعلومات» وظروف إصدار 
الأحكام» واختيار المقياس )1994 (Schamber,‏ وفضلا عن ذلكء يؤثر عامل 
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التعلم» وتسلسل عرض نتائج عملية البحث أيضا في أحكام الصلاحية (Froehlich,‏ 
(1994. فبإمكان من يصدر الحكم أن يتعلم في أثناء عملية الحكم على الصلاحية. 
ومن المحتمل للوثيقة نفسها أن يصدر الحكم Geb‏ أكثر صلاحية؛ إذا ما قدمت في 
موقع متقدم لا في موقع متأخر في عملية التقيبم. وغالبا ما يضيف إلى التعقد المتزايد 
فعلاء والصعوبة والإحباط في الحكم على الصلاحية» قيام شخص cle‏ خلاف المستفيد 
النهائي (كاختصاصي المعلومات) بالحكم على الصلاحية» وخصوصافي بيئات 
عمليات البحث التي تحظى بالمساعدة» كا في نظم الخط المباشر. 1 

فالصلاحية مفهوم pare‏ إلا أنها ظاهرة نسقية وقابلة للقياس (Schamber,‏ 
Eisenberg & Nilan, 1990)‏ ويمكن القول ببساطة أن الصلاحية خاصية تعبر عن 
العلاقة بين الوثيقة واستفسار المستفيد. وبين| يبدو من الصعب إصدار حكم دقيق 
وموضوعي على الصلاحية؛ فإنه من الممكن الحصول على تقدير لقيمتها. وبتعين على من 
يقومون بالتقييم» أن يضعوا في الوقت نفسه في ا لحسبان» القضايا التي طرحت ونوقشت 
في هذا القسم الفرعي» عندما يكونون بصدد الحكم على صلاحية نتائج الاسترجاع. 

وبعد أكثر من ثلاثين عاما من نشر مراجعته العلمية الضافية حول الصلاحية 
(Saracevic, 1975)‏ أعد ساراسفك مراجعة علمية من جزأين بالعنوان نفسه إلا 
أنه ميزهما بالجزء الثاني (Saracevic, 2007a)‏ والجزء الثالث (Saracevic,‏ 
(2007» ليبين cles keel‏ استطراد لعمله البذري الذي نشر عام ١۱۹۷ء‏ وإن لم يكن 
حينئذ قد عنون بالجزء الأول. وبعد المزيد من المراجعات العلمية oy gal‏ الصلاحية 
من حيث طبيعته» وتجلياته» ومضامينه» خلص ساراسفك إلى أن الصلاحية» بوصفها 
المفهوم الأساس في استرجاع المعلومات» جوهرية؛ ومن ثم فإن البحث والنقاش 
حول الصلاحية سيظل [slo‏ في وقته وأوانه. 
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تحديد جميع الوثائق الصالحة في نظام ما: 
يقة تعريف الصلاحية وقياسها مجرد مشكلة واحدة فقطء في حساب 
الاستدعاء والتحقيق. وينطوي المأزق الآخر على تحديد كل الوثائق الصالحة 
لاستفسار ما في نظام ما لاستزجاع المعلومات. وما لم يكن النظام قد أنشئ لأغراض 
تجريبية» فإنه يبدو أن لا سبيل لمعرفة مجمؤع الوثائق الصا حة في النظام» لاستفسار 
معين على وجه التحديد. إلا أن ذلك العدد. المقام في المعادلة: 
۸= ا/ +f)‏ ج)ء لا غنى عنه بالنسبة لحساب الاستدعاء. 

وقد اقترحت عدة طرق» على مر السنين» للتغلب على هذه المشكلة (Large,‏ 
.Tedd & Hartley, 1999)‏ والتجمع pooling‏ واحد من مثل هذه الطرق؛ ففي 
امقام الأول يقوم مستفيدون مختلفون بإجراء عملية البحث نفسهاء على افتراض أنه 
إذا ما تمت عدة محاولات كافية لإجراء عملية البحث؛ فإن معظم. إن لم يكن كل 
الوثائق الصالحة يمكن العثور عليها في النهاية مرة واحدة على الأقل» ثم يتم بعد 
ذلك» تجميع النتائج التي أسفرت عنها جميع عمليات البحث معاء مع استبعاد 
المكررات. ولحساب الاستدعاء حينئذ» يمكن مقارنة نتائج أي من عمليات البحث» 
مقابل هذه الفئة المجمعة من الوثائق الصا حة في النظام. وقد تم تطبيق طريقة التجمع 
هذه في سلسلة مؤتمرات استرجاع النصوص TREC‏ لحساب الاستدعاء 
(Harman, 1995)‏ بالإضافة إلى مشروعات أخرى (راجع على سبيل JUN‏ 
(Clarke & Willett, 7‏ ومن ثم» يثار السؤال حول كم عدد عمليات البحث 
التكرارية يتطلب الأمر إجراؤهاء حتى يشعر أولئك الذين يستخدمون طريقة التجمع 
بالثقة بأنه قد تم تجميع ما يكفي من الوثائق الصا حة. 

والنهج الآخر لتقدير إجمالي عدد الوثائق [الصا حة] في نظام cle‏ هو أن يطلب 
من خبير واحد أو أكثر» تجمعهم خبرة إجراء عمليات البحث والمعرفة ال موضوعية» 
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إجراء عمليات البحث» مع الافتراض Ob‏ هؤلاء الخبراء سوف يعثرون على جميع 
الوثائق الصا حة في النظام. ومن الممكن مراجعة النتائج التي أمكن J pah‏ عليها من 
جانب فئة أخرى ممن يجرون عمليات البحث» كفئة المبتدئين» مقابل عمليات بحث 
هؤلاء الخبراء؛ لقياس الاستدعاء. ويمكن تسمية هذا النهج بطريقة الخبراء. 

وبالإضافة إلى طريقة التجمع» وطريقة الخبراء» تناول كل من لارج وتد 
وهارتلٍ )1999( isali 14, Large, Tedd & Hartley‏ الفرعية Subset‏ وفي 
هذه الطريقة» يتم فحص الوثائق الواردة في فئة فرعية صغيرة من مرصد بيانات 
النظام» كلا على حدةء للعثور على الوثائق الصا حة. والافتراض الذي يستند إليه هنا 
هو أن المجموعة الفرعية أو الفئة الفرعية subset‏ تمثل النظام برمته» مما يوحي 
بضرورة تطبيق أسلوب العينة العشوائية» لاختيار الفئة أو المجموعة الفرعية. وحينئذ 
يصبح التقدير القائم على الفئة الفرعية هو المقام لحساب الاستدعاء. 

وكا هو واضح» فإن الحصول على مقياس للاستدعاء لتقييم أداء الاسترجاع» 
أشبه بإحصاء عدد الأسماك في البحيرة. والمهمة أقرب للمستحيل؛ نظرا OY‏ مرصد 
بيانات النظام ديناميكي» دائم التغير. وجميع الطرق التي ناقشناها هناء IS]‏ هي في 
أحسن الأحوال تقديرات جيدة» وفي أسوأ الأحوال حصن تخمينات صريحة (Large,‏ 
-Tedd & Hartley, 1999)‏ 


انتقادات الاستدعاء والتحقيق الأخرى: 


d‏ يتم التوصل» |S‏ يبدوء إلى إجابات مرضية كافية للسؤالين اللذين سبق 
طرحهماء بشأن الصلاحية» ومجموع عدد الوثائق: الصا حه في نظام ماء إلا أن مزيدا 
من الانتقادات وجهت للاستدعاء والتحقيق كمقياسين للتقييم؛ فقد تمت الإشارة» 
على سبيل المخال» إلى أن الاستدعاء والتحقيق مقياسان غير كاملين للتقييم؛ نظرا لأن 
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عوامل كالتفاعلية» والتكلفة» وسرعة الاسترجاعء ينبغي أيضا أن توضع في الحسبان 
(ر اجع على سبيل المثال 1999 .(Large, Tedd & Hartley,‏ كذلك ذهب ملر 
وتجلر )1986( J| Miller and Tegler‏ أن: 


الطرق التقليدية لتقييم عمليات البحث عن المعلومات - 
الاستدعاء والتحقيق - قد أغفلت تماما هذا الجانب التوليدي الإبداعي 
لعملية البحث. وبتقييم الناتج وليس العملية» فإن الاستدعاء والتحقيق 
يحدان من فهمنا لعمليات البحث عن المعلومات» ويعجزان عن قياس 
هذه العمليات على نحو فعال. )371 (p.‏ 
وبعبارة أخرى» OB‏ مقاييس أخرى خلاف الاستدعاء والتحقيق» ينبني أن 
تطبق في تقييم استرجاع المعلومات. وكما أشار سالتون )1992( Salton‏ فإن 
الافتراض الرئيس وراء استخدام مقاييس كالاستدعاء والتحقيق» هو أن المستفيد 
العادي 2 مهتم باسترجاع كميات كبيرة من المواد الصالحة (نما يسفر عن استدعاء مرتفع) 
one‏ ا a‏ 
وقد لا تتحقق هذه الافتراضات على الدوام؛ ففي] عدا حالات كاسترجاع براءات 
الاختراع» على سبيل المثال» فإنه قد لا يكون المستفيدون حريصين على عمليات بحث 
شاملة» الأمر الذي يشكك في صلاحية الاستدعاء كمقياس للتقييم. 
يضاف إلى ذلك» أنه ليست هناك طريقة للتعبير عن الدرجات المختلفة 
للصلاحية عند حساب الاستدعاء؛ فجميع الوثائق الصالحة يفترض عادة أن تكون 
ذات قيمة متساوية» بصرف النظر عم إذا كانت صلاحيتها هامشية أو بؤرية 
(Chowdhury, 1999)‏ ولا يمكن تغيير هذا الافتراض» Lo per g‏ عندما يكون 
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العدد الإجمالي للوثائق الصا حة في نظام ماء بحاجة إلى تقدير بواسطة الطرق التي 
تناولتاها في ۲/۱/۲/۱/۱۱. 


ويبدو الاستدعاء والتحقيق كمقياسين للتقييم» أبعد ما يكونان عن ASEM‏ كما 
يبدو الاستدعاء أكثر المقياسين إثارة للجدل. إلا أنه على الرغم من كل الانتقادات 
والجدل» فإن مقياسي الاستدعاء والتحقيق يشكلان الأساس بالنسبة لعمليات التقييم 
cdi pall‏ لكل من نظم الاسترجاع العاملة والمختبرية أو التجريبية )1992 (Salton,‏ 
وقد تطورت في الوقت نفسه أشكال متعددة لمقياسى الاستدعاء والتحقيق» هدف 
التخلص مما يكتنف معياري التقييم نيرق ون اركح gaia‏ 
الأشكال المختلفة لمقياسي الاستدعاء والتحقيق: 

لقد تم اقتراح متوسط الاستدعاء أو التحقيق» لدحض افتراض القيمة 
المتساوية لصلاحية الوثائق المسترجعة. ولم تعد الصلاحية في هذه الطريقة خاصية 
ثنائية (أي صالح أو غير صالح) في حساب متوسط الاستدعاء أو التحقيق. وعوضا 
عن ذلك فإن الصلاحية تقاس بمقياس من س من النقاط (س- ۳ VV... »٤‏ لبيان 
ake‏ درجات الصلاحية. وإذا ما استعمل مقياس من ثلاث نقاط على سبيل المشال» 
فإنه يمكن إعطاء قيمة من صفر أو ٠.5‏ أو ٠.١‏ لكل وثيقة مسترجعة. ومن الممكن 
بعد ذلك حساب متوسط القيم المعطاة لجميع الوثائق المسترجعة حول موضوع ماء 
بحيث يمكن وضع تفاوت الصلاحية في الوثائق المسترجعة» في الحسبان. وليس من 
الضروري أن يقتصر عدد النقاط في المقياس» على ١١‏ أو أقلء إلا أنه يمكن للتقسيم 
153841 أن بق هة الات Sy‏ سيق أن مقا ols‏ سات مر مط 
الاستدعاء» أصعب من قياس متوسط التحقيق؛ نظرا لصعوبة تحديد العدد الإجمالي 
للوثائق الصا حة في نظام ما. 
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وفي افتداد هذه الطريقة» غالبا ما يتم حساب متوسط الاستدعاء أو متوسط 
التحقيق» بالنسبة للوثائق المسترجعة حول موضوع ماء المتربعة على القمة س (س= 
ا Gee‏ إذا كانت النتائج مرتبة طبقيا وفقا للصلاحية المنتظرة. وقد 
طبقت سلسلة مؤتمرات استرجاع النصوص TREC‏ هذا المقياس على نطاق eels‏ 
أي متوسط الاستدعاء أو متوسط التحقيق» عند الحدود القصوى للمخرجات 
(Hartman, 1995)‏ وقد قامت تشو وروزنتال )1996( Chu and Rosenthal‏ 
بحساب متوسط التحقيق للنتائج العشر المسترجعة المتربعة على القمة» عندما كانتا 
بصدد تقييم نظم استرجاع الإنترنت التافيستا AltaVista‏ وإكزايت Excite‏ 
Lycos» Ky‏ ويكفل متوسط الاستدعاء أو متوسط التحقيق» عند الحدود 
القصوى للمخرجات» بديلا عمليا لمقياسي الاستدعاء والتحقيق العاديين» وخصوصا 
عزتنا وك laps lab E E‏ 

والاستدعاء المعياري أو التحقيق المعياري normalized‏ شكل آخر 
للاستدعاء والتحقيق» يضع في الحسبان التدابع الذي تقدم به الوثائق المسترجعة 
للمستفيد؛ فمن الممكن مثاليا لنظام استرجاع المعلومات» أن يقدم جميع الوثائق 
الصالحة» قبل عرض أي من الوثائق غير الصالحة. وإذا ما أعطيت القيمة (١)لنظام‏ 
مثالي» والقيمة (صفر) لأسوأ نظام ممكن» ذلك النظام الذي يمكن فيه تقديم جميع 
الوثائق غير الصالحة للمستفيد» قبل تقديم أي وثيقة aL Le‏ فإن تلك القيمة تصبح 
المعامل في حساب الاستدعاء أو التحقيق المعياريين. وقد وصف كل من كورفيح 
Korfhage (1997)‏ وفوسكت )1996( Foskett‏ طريقتين مختلفتين Lit‏ 
الاستدعاء المعياري. كذلك يمكن حساب التحقيق المعياري على النحو نفسه. 
والافتراض الآخر بالنسبة لهذا المقياس» هو أن يكون المرء على درايبة بكل الوثائق 
الصالحة في نظام cle‏ وهو مأزق le‏ بالنسبة لحساب الاستدعاء» ومن ثم فإن احتمال 
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هذا المقياس يعاني أيضا من ذلك الافتراض غير المحتمل. وفضلا عن ذلك» فإن 
الاستدعاء أو التحقيق المعياري» يتطلب في جوهره ترتيب خرجات الاسترجاع طبقيا 
وفقا للصلاحية المنتظرة. 

والاستدعاء التسبي هو نسبة الوثائق الصالحة المسترجعة التي فحصها 
المستفيد, إلى عدد الوثائق الصالحة التي يعلم المستفيد بوجودها في النظام & (Harter‏ 
«Hert, 1997)‏ أو يمكن أن يود فحصها )1997 .(Korfhhage,‏ لنفترض على سبيل 
المثال» أن المستفيد يعتقد أن هناك في النظام ٠١‏ وثيقة صالحة حول استفسار معين» 
وبعد إجراء عملية البحث يسترجع المستفيد عشر وثائق» حكم Leb Lede‏ صا حة. 
حينئذ يكون الاستدعاء النسبي لعملية البحث هذه ٠١‏ با مئة. ومن الؤاضح أن 
الاستدعاء النسبي قد اقترح بقصد التغلب على المشكلات المرتبطة بالاستدعاء إلا أنه 
هنا أيضاء يظل التساؤل قائأ» كيف يمكن للمستفيد أن يعرف» على سبيل المثال» عدد 
الوثائق الصالحة في نظام ما؟ والإجابة هي ما اقترح في ۲/١/۲ /١/1١‏ بالنسبة 
لتحديد إجمالي عدد الوثائق الصا حة في النظام (كطريقة التجميع على سبيل (SLEW‏ 
وتعاود المشكلة القديمة نفسها الظهور بعد التحول إلى ما يسمى الاستدعاء النسبي. 

ومقياس إي E-measure‏ الذي اقترحه سويتس )1969( Swets‏ جمع 
موزون بين التحقيق والاستدعاءء لقياس فاعلية الاسترجاع» ومن الممكن حسابه 
بالمعادلة التالية: 

E=1-1/ [BP -1 + (1 + 8) R- 1] 

ويستعمل المعامل 6 في هذه المعادلة للتعبير عن التركيز على أي من التحقيق أو 
الاستدعاء؛ فعلي سبيل JEN‏ فإن 1 = م يقابل إضفاء أهمية متساوية على كل من 
التحقيق والاستدعاء. و2 B = 0.5 and‏ تقابل إضفاء نصف أو ضعف الأهمية على 
الاستدعاء كا على التحقيق» على التوالي. وكلما انخفض مقياس إي 8 ارتفع مستوى 
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فاعلية نظام الاسترجاع. وقد طبق مقياس إي» على سبيل المثال» من جانب جريفيث 
ولاكهرست وويلت )1986( «Griffiths, Luckhurst, and Willett‏ 
دراستهم. ويمكن إبداء ملاحظتين بشأن مقياس إي؛ الأولى أنه يمكن أن يضفي 
درجات مختلفة من التركيز على أي من الاستدعاء أو التحقيق. ASL,‏ أنه يضم كلا 
من الاستدعاء والتحقيق في مقياس واحد للفاعلية. وكا سيتبين لنا فيا بعد فإن 
مقياسا واحدا للتقييم هو المفضل كثيرا في أوساط استرجاع المعلومات. 

وتكفل الأشكال المختلفة للاستدعاء والتحقيق» وجهات نظر وبدائل مختلفة 
لمقياسي التقييم. إلا أن أيا من الأشكال المختلفة لا يمكن أن يتغلب على نحو 
ظهرت مقاييس تقييم إضافية (كالتسرب fallout‏ على المثال) على مر السنين. 
التسرب: 

يعرف التسرب fallout‏ الذي طرحه سويتس )1963( Swets‏ في البداية» بنسبة 
الوثائق غير الصا حة المسترجعة إلى جميع الوثائق غير الصا حة في مرصد بيانات النظام. 
ويتم تحديد التسرب E)‏ على النحو التالي باستعمال الرموز الواردة في الجدول 
رقم ۱/۱۱: 

=F‏ / (ب + د) 

ويقيس التسرب عجز نظام استرجاع المعلومات عن استبعاد الوثائق غير 
الصالحة من نتائج الاسترجاع» الأمر الذي يسميه روبرتصون )1969( Robertson‏ 
معامل الشوشرة noise factor‏ وتتراوح dad‏ التسرب مابين الصفر والواحد» 
شأءها في ذلك شأن الاستدعاء والتحقيق» إلا أنه كلا انخفضت قيمة التسرب» كان 
نظام استرجاع المعلومات أفضل من وجهة نظر التقييم. 
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وكا في IL‏ حساب الاستدعاءء op‏ إجمالى عدد الوثائق غير الصا حة في النظام 
غير معروف» ومن ثم فإن ذلك العدد ينبغي تقديره» باتباع الطرق التي سبق أن 
نوقشت بالنسبة لتقدير الاستدعاء. ولا يبدو التسرب بوجه عام مقياس تقييم 
يستخدم بكثافة» على الرغم من أن روبرتصون )1969( Robertson‏ صرح ok‏ بياني 
علاقة الاستدعاء بالتحقيق» (بياني يوقع قيم هذين المقياسين) لا يمكن تفسيره 
بسهولة كبياني علاقة الاستدعاء بالتسرب» وذهب إلى أن التحقيق ليس بالمقياس المفيد 
للأداء بنفس أهمية التسزب مرتبطاً بالاستدعاء. 


العمومية: 

تعرف العمومية generality‏ بوصفها نسبة الوثائق في مرصد بيانات النظام» 
الصالحة لموضوع معين. وبناء على الرموز الواردة في الجدول رقم COLVIN‏ 
(العمومية) يمكن حسابها على النحو التالي: 

+e‏ ج)/ (أ+ ب + ج + د) 

وكلم| ارتفع مدى العمومية (أو كلما ازدادت BUS‏ الوثائق الصا حة في مرصد 
البيانات) ازداد ميل عملية البحث للسهولة )1993 «(Lancaster & Warner,‏ إلا 
أن العمومية» على وجه التحديد» مقياس do gd‏ مرصد البيانات من منظور الصلاحية» 
وليست مقياسا لآداء الاسترجاع مباشرة. وفضلا عن AUS‏ فإنه من الصعب دائم| 
تحديد عدد الوثائق الصالحة التي لم تسترجع من النظام» أي قيمة جف الجدول 
رقم ۱/۱۱. 


المقاييس الأحادية لتقييم استرجاع المعلومات: 


من بين انتقادات الاسنتدعاء والتحقيق عدم اکت اهم كمقياسين للتقييم (راجع 
١ 1‏ "). وهذا هو السبب وراء استعمال الاستدعاء والتحقيق Bole‏ 
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بالجمع مع- وربما إلى جانب- معايير أخرى لأغراض التقييم. ويمكن للأمر أن يكون 
مثالياء إن كان من الممكن استخدام مقياس تقييم واحد. بإدخال العوامل ال منصلة في 
الحساب. ويكاد مقياس إي E‏ يكون مثالا للمقياس الواحد لتقييم استرجاع 
المعلو مات. فقد اقترح كوبر Cooper (1973a, 1973b)‏ مقیاسا للانتفاع «utility‏ 
يقوم على الحكم الذاتي للمستفيد» على نظام استرجاع المعلومات» من حيث فائدته. 
ومن الممكن قياس الانتفاع من النظام بطريقة مختلفة» مادام ذلك يتفق ونظرية كوبر 
للمنفعة؛ فقد طلبت سو (1991) Sur‏ على سبيل المثال» من المستفيدين تقييم الانتفاع 
ee)‏ عمليات البحث. ely‏ على نوع ما من مقياس ليكرت Likert‏ المكون من سبع 
درجات» وذلك بالنظر في قيمة نتائج عمليات البحث ككل. وقد تبين ها أن مقياس 
الانتفاع هذاء كان أفضل مقياس قائم بذاته للأداء التفاعلي لاسترجاع ا معلومات» من 
بين عشرين مقياسا وقع عليها اختيارها من أجل دراستها. 

كذلك يمكن أيضا تعريف مقاييس الانتفاع بطريقة مختلفة؛ كقيمة الوثائق 
المسترجعة JSS‏ في مقابل الوقت المستنفد. وتحدد القيمة بالدولارات» والإسهام في 
حل المشكلات )1988 .(Saracevic, et al., 1988; Saracevic & Kantor,‏ إلا 
أنه أيا كانت الطريقة التي يتم بها تعريف الانتفاع في التقييم» فإن هذا المقيناس يعتمد 
دائ على الحكم الذاتي للمستفيد. وتفضي ذاتية هذا المقياس إلى نفس ما يبديه المهتمون 
من تخوف عند إصدار أحكام الصلاحية» لأجل حساب الاستدعاء والتحقيق. 


مقاييس التقييم الأخرى لاسترجاع المعلومات: 

عقب جريفيث )1986( Griffith‏ يوماء قائلا بأنه من الممكن استخدام ثلاثة 
أرقام فقط في تقييم نظم استرجاع المعلومات؛ عدد الوثائق الصالحة المسترجعة» وعدد 
الوثائق غير الصالحة المسترجعة. وإجمالي ode‏ الوثائق ف مرصد بيانات النظام. ومن 
الممكن الحصول على هذه الأرقام Lae‏ دون أي تقدير أو تخمين. ويمكن لنسبة 
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الوثاتق الصا حة المسترجعة إلى إجمالي عدد الوثائق في مرصد بيانات نظام ماء أن 
توضح قدرة النظام على العثور على الوثائق الصالحة. وكذلك الحال أيضاء يمكن 
لنسبة عدد الوثائق غير الصا حة المسترجعة إلى إجمالي عدد الوثائق في مرصد بيانات 
نظام ماء أن تبرز القدرة التمييزية للنظام؛ أي القدرة على رفض الوثائق غير الصا حة» 
إلا أن قليلا من مشروعات التقييم وضعت فكرة جريفيث في حيز التطبيق. 

وقد مرت مقاييس التقييم بالنسبة لاسترجاع المعلومات برحلة طويلة ما تزال 
مستمرة. ومن بين جيْع المقاييس التي نوقشت في هذا السياق؛ يحظى الاستدعاء 
والتحقيق بمعظم الاهتام» فضلا عن معظم النقد أيضا. إلا أن هذين المقياسين هما 
المقياسان بحكم الواقع بالنسبة لمعظم جهود التقييم؛ نظرا لأنه من السهل تفسيرهما 
من حيث استرجاع الوثائق المرغوب فيهاء ورفض الوثائق الغريبة )1992 (Salton,‏ 
وسوف يظل الاستدعاء والتحقيق هما المقياسان الرئيسان للتقييم» بالنسبة لاسترجاع 
المعلومات. ما لم تتطور بدائل أفضل منه) وتثبت جدارتها. 


معابير تقييم نظم استرجاع المعلومات: 

الاستدعاء والتحقيق وغيرهما من المقاييس الأخرى التي سبقت مناقشتهاء إن 
هي لتقييم أداء الاسترجاع في الأساس. وأداء الاسترجاع |S‏ يبدو» جانب واحد فقط 
من جوانب استرجاع المعلومات» وذلك على الرغم من أنه ى] سبق أن تبين لناء يوليه 
المستفيد النهائي أقصى اهتام. إلا أنه لتكوين نظرة كاملة لمدى كفاءة أداء نظام 
استرجاع المعلومات» ينبغي وضع مقايبسن أخرى خلاف تلك الخاصة بتقييم أداء 
استرجاع المعلومات في الحسبان. وينبغي استخدام مقاييس مختلفة لمختلف أنواع نظم 
استرجاع المعلومات. وتنظر الأقسام التالية في معايير التقييم بالنسبة لكل نوع من 
الأنواع الأربعة لنظم استرجاع المعلومات» وهي نظم الخط المباشرء ونظم الفهارس 
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المتاحة على الخط المباشر (OPACS)‏ ونظم استرجاع الإنترنت» ونظم استرجاع 
الوسائط المتعددة (وإن كانت نظم استرجاع الوسائط المتعددة لم تعالج كنوع متميز في 
(asl J gual‏ 


معايير تقييم نظم الخط المباشر: 

لقد كان لنظم الخط المباشر أطول تاريخ» بين الأنواع الأربعة الرئيسة لنظم 
استرجاع المعلومات (راجع الفصل الثامن)» ومن ثم فإنها كانت موضوع كثير من _ 
دراسات التقييم. كا أن معايير تقييم نظم الط المباشر مصممة بطرق مختلفة. 

ووفقا لما ذهب إليه لانتكستر ووورنر )1993( «Lancaster and Warner‏ 
فإنه من الممكن لعمليات تقييم نظم الخط المباشرء أن تتم على ثلاثة مستويات: )١(‏ 
عمليات تقييم الفاعلية» (Y)‏ عمليات تقييم فاعلية التكلفة» (؟) عمليات تقييم عائد 
التكلفة. ويضع المستوى الأولء عمليات تقييم الفاعلية effectiveness‏ في الحسبان 
كلا من التكلفةء والوقت» وجودة النظام. وتحاول عمليات التقييم هذه الكشف عما 
إذا كان النظام يعمل بفاعلية [ed‏ يتعلق بحاجة المستفيدين. ويربط المستوى الثاني» 
عمليات تقييم فاعلية التكلفة ccost-effectiveness‏ عامل التكلفة بفاعلية النظام» 
بحيث يمكن المقارنة بين نظامين مختلفين لاسترجاع المعلومات بسهولة» في هذا 
المستوى. فكم على سبيل المثال» تبلغ تكلفة استرجاع وثيقة صالحة من نظام ما؟ 
ويمكن للضرب نفسه من المقارنة أن يكون من الصعب إجراؤه في المستوى الأول» 
نظرا OY‏ تلك المقايبس غير معيارية. أما المستوى الثالث» تقييم عائد التكلفة cost-‏ 
cbenefit‏ فيذهب إلى ما هو أبعد من المستويين السابقين» وذلك بتقييم تكلفة تشغيل 
أ نظام استرجاع المعلومات» مقابل العائدات التي تتحقق نتيجة لوجود النظام. 5 [AS‏ 
ارتفع مستوى التقييم» ازداد تعقد معايير التقييم. وتميل معايير المستوى الأول (أي 
زمن الاستجابة أو تغطية مرصد البيانات على سبيل (SLU‏ لأن تكون مباشرة أو 
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صريحة. وتحتاج مقاييس المستوى الثاني إلى بعض الحسابات. dy‏ مقابل ذلك تتطلب 
معايير المستوى الثالث» إصدار الأحكام وتوافر البراهين» على نحو أكثر بكثير من 
التقييم البسيط. ومن الممكن تطبيق معايير التقييم» في جميع المستويات الثلاثة» في 
مشروع تقييم واحدء غير أنه في التطبيق العملي» تستخدم مقاييس المستويين الأول 
والثاني» ومقاييس المستوى الأول على وجه الخصوص. في معظم الأحيان» في تقييم 
نظم الخط المباشر؛ نظراً لجدوى هذه المقاييس وقابليتها للتطبيق. 

وعلى الرغم من وضع معايير مختلفة لتقييم نظم الخط المباشر» يبدو أنه قدتم. 
التوصل إلى إجماع حول أي الجوانب ينبغي أن تخضع للتمحيص. وقد لخص لانكستر 
وفاين )1973( Lancaster and Fayen‏ هذه الجواتب E‏ شكل ستة معايير: )١(‏ 
التغطية» (۲) الاستدعاءء )1( التحقيق» CE)‏ زمن الاستجابة» )0( جهد المستفيد» 
JRE CV)‏ المخرجات. ومن عجب» أن نرى أن القدرة على إجراء عمليات البحث لم 
تدخل ضمن هذه المجموعة من معايير التقييم. 

والتغطية معيار تقليدي لتقييم مرصد بيانات النظام. وتشمل الأوجه المحددة 
لتغطية مرصد البيانات أنواع الوثائق (كبراءات الاختراع» ومقالات الدوريات» 
وتقارير البحوث على سبيل (JE‏ وعدد الوثائق» وتتابع التجديد, والمدى الزمني 
للتغطية الراجعة. وتحدد تغطية مرصد بيانات النظام ما يمكن استرجاغه (cB‏ 
بعد من النظام. 

والاستدعاء والتحقيق جزء من معايير التقييم لقياس أداء الاسترجاع. وقد 
أصبح olia‏ المقياسان» كما بينا في ۲/١/١١‏ المكونات التقليدية في معظم جهود 
التقييم» إلا أنه لم يتم وضع مواصفة معيارية لمعدلات الاستدعاء والتحقيق المرضية 
وذلك لسببين؛ LA sl‏ أنه من الممكن للمستفيدين المختلفين أن تكون لهم توقعات 
مختلفة لكل من الاستدعاء والتحقيق» في الظروف المختلفة؛ فإذا كان هناك على سبيل 
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المثال مستفيد ينوي إعداد مراجعة علمية للوضع الراهن للمعرفة في موضوع ماء OLS‏ 
الاستدعاء giv Il‏ يمكن أن يكون هز ارقم وإذا كات اليد لا يتم إلا seb‏ 
التطورات في مجال ماء فإنه يمكن للتحقيق المرتفع أن يكون هو المتوقع. والسبب 
الآخر لغياب مواصفة معيارية معدل الاستدعاء والتحقيق الذي يمكن قبوله» هو 
علاقة التناسب العكسي التي يفترض وجودها بين المقياسين؛ فممن الممكن للزيادة في 
أحدهما أن تفضي إلى تناقص في الآخر. ومن ثم فإنه من الصعب إيجاد حد أمثل لكل 
oles ys‏ و adel‏ رصاق إن و :أن ی ر د انات اا ا ل 
وضع حد للاستدعاء والتحقيق المرضيين. ومن الممكن لمعدلات التحقيق المنخفض 
أن تكون أقل قابلية للتغاضي عنهاء في مراصد البيانإت الأكبر» ما هي عليه في مراصد 
البيانات الأصغر. فمن الممكن على سبيل JEL‏ لمستفيد ما أن يكون على استعداد للنظر 
في ستين تسجيلة مسترجعة» للتحقق من أن نينها عشرون صالحة» إلا أنه قد يكون أقل 
استعداداً بكثير» OY‏ ينظر في ستمئة تسجيلة للعثور على مشتين» على الرغم من أن 
معدل التحقيق في كلا الحالتين» قد يكون (Lancaster & (14L ۳۳) oly‏ 
Waner, 1993)‏ . 

ويدل زمن الاستجابة على الوقت المستنفد بين تقديم الاستفسار وتلقي 
النتائج. ويبدو هذا المعيار لا غنى عنه» وخصوصا في نظم الخط المباشر في أيامها 
المبكرة» عندما كانت تقنيات المعلومات (كالاتصالات بعيدة المدى» وطاقة الحاسبات 
على سبيل المثال) في مرحلة طفولتهاء وكان استرجاع المعلومات» اعتمادا على نظم 
الخط المباشر باهظ التكلفة. فإذا كان بإمكان نظام استرجاع المعلومات تجهيز 
الاستفسارات بسرعة. فإنه يمكن الحد من تكلفة استخدامه»ء الأمر الذي يفسر أهمية 
وجود هذا المعيار في التقييم. 
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وينطوي جهد المستفيد كمعيار للتقييم» على عدة عناصر» جميعها يقيس مقدار 
الجهد الذي يتعين على المستفيد أن يبذله» لإجراء عمليات البحث في By‏ الاسترجاع 
على الخط المباشر؛ فكم من الوقت» على سبيل المثال» يستغرقه إلمام المستفيد بالنظام أو 
التآلف معه؟ ما مدى تعاطف تفاعل المستفيد مع النظام؟ أي أنواع الدعم' 
(كالموجزات الإرشادية المطبوعة» أو المساعدة على SLA LAT‏ على سبيل المغال) 
تتوافر للمستفيد؟ وكلما قل الجهد الذي يحتاج المستفيد إلى بذله. كان النظام أفضل. 
ومن الخواص الفريدة لنظم الخط المباشر» أن اختصاصيي المعلومات كوسطاء غالبا 
ما جرون عمليات البحث نيابة عن المستفيدين النهائيين» كما pel‏ مدربون على نحو 
أفضل من تدريب هذه الفئة الأخيرة. وينبغي تذكر هذا الاختلاف» عندما يكون المرء 
بصدد النظر في عامل جهد المستفيد» في التقييم. 

ويمثل شكل المخرجات المعيار الأخير» الذي وضع للتقييم في نظم الخط 
المباشر؛ فمن الممكن تقديم مخرجات عمليات البحث على الخط المباشر بطرق مختلفة 
(كالمعلومات الوراقية فقط) أو المعلومات الوراقية مصحوبة بمستخلصات» على 
سبيل (JEU‏ وعادة ما تكفل نظم الخط المباشر الكثير من خيارات المخرجات» إلا Lal‏ 
لا ترتب تلقائيا نتائج البحث طبقيا؛ نظرا OF‏ استخدام مقومات الترتيب الطبقي 
(كالأمر RANK‏ في ديالوج DIALOG‏ على سبيل المشال) عادة ما يكون باهظ 
التكلفة. وعادة ما تقدم نتائج الاسترجاع من نظم الخط المباشر» في ترتيب زمني 
تنازلي؛ أي أن تأتي أحدث تسجيلات أضيفت إلى مرصد البيانات في الصدارة. وكا 
تبين GW‏ ۱۰/ ۳/ ۲/ ۲ء فإن المرونة هي الكلمة المفتاح للحصول على أفضل تقييم في 
هذا الصدد. 

وقصارى القول» فإن التغطيةء والاستدعاء» والتحقيق» وزمن الاستجابة: 
وجهد المستفيد» وشكل المخرجات,. قد استخدمت كمعايير تقييم لنظم الخط المباشرء 
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على الرغم من وجود بعض مظاهر GHEY‏ أحيانا. ويمكن هذه المعايير أن SASS‏ 
أيضا أساسا لتقييم الأنواع الأخرى لنظم استرجاع المعلومات. 
معايير تقييم الفهارس المتاحة على الخط المباشر: 

fez‏ الفهارس المتاحة على الخط المباشر OPACs‏ المصممة للعثور على 
المعلومات الوراقية المتعلقة بمجموعة مكتبة ماء نوعا فريدا من نظم استرجاع 
المعلومات. وقد تطورت معايير التقييم الخاصة بهذه الفئة من النظم» في المقام الأول 
عن طريق الدراسات المقارنة» ويبدو التقرير الذي أعده هايلدرث Hildreth‏ 
)1982( هو الأقوى أثرا في هذا التطور. بل إن جونز Hildreth, 1982, $) Jones‏ 
(p.xii‏ قد تكهن بأن أي جهد تال في هذا المجال.م يكن بمنأى عن التأثر بتقرير 
هايلدرث. وقد شكل الإطار الذي قدمه في هذا التقرير» فعلا الجهود التي تلت» في 
تقييم الفهارس المتاحة على الخط المباشر (راجع على سبيل O'Rourke, 1987; Juli‏ 
(Salmon, 1983‏ وذلك على الرغم من أن البحث لم يقصد به أن يكون تقيي| لعشرة 
فهارس متاحة على الخط المباشر» تمت دراستها )1985 Lary (Hildreth,‏ استشارة 
البحوث الصا حة في الموضوع (مثل 1982 (Hildreth,‏ أعد أورورك O'Rourke‏ 
)1987( لأغراض التقييم» قائمة مراجعة» من 40 سؤالاء مقسمة على حمس فئات 
هي: )١(‏ الخواص التشغيلية» (۲) نقاط الوصولء (Y)‏ خواص البحث؛ )٤(‏ خواص 
العرض» )0( خواص مساعدة المستفيد. ومن الممكن هذه الفئات الخمس أن تشكل 
على نحو معقول» معايير تقييم للفهارس المتاحة على الخط المباشر. 

ويتعلق معيار الخواص التشغيلية بكيفية تفاعل المستفيد فعلا مع الفهرس المتاح 
على الخط المباشر؛ كيف. على سبيل المثال» يصل المستفيد إلى النظام؟ هل يكفل النظام 
للمستفيد اختيار هدف (كمجموعة المكتبة المحلية» أو de pot‏ تكتل للمكتبات» على 
سبيل المثال) لإجراء عمليات البحث. بالإضافة إلى الخيار الافتراضي Sdefault‏ هل 
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بإمكان المستفيد تعديل البحث أو تغيير أوضاع النظام الافتراضية (كعرض 
التسجيلات الموجزة على سبيل المثال)؟ هل من السهل بالنسبة للمستفيد الانتقال من 
مستوى عرض إلى آخرء أو من إحدى التسجيلات إلى ما تليها أو ما سبقتها؟ ولقد 
كانت واجهة التعامل interface‏ (أي لغة إصدار الأوامر في مقابل الاختيار من قائمة 
الخيارات) من الموضوعات الجوهرية عندما وضعت معايير التقييم تلك» إلا أنها تبدو 
أقل صلاحية بالنسبة للفهارس المتاحة على الخط المباشر في الوقت الراهن؛ نظرا لأن 
قليلا من هذه النظم لا يزال يطبق لغة إصدار الأوامر. ولقد كان للتحول من 
الفهارس البطاقية إلى الفهارس المتاحة على الخط المباشرء أثره البالغ في تفاعل المستفيد 
مع النظام» الأمر الذي يبدو مبررا رئيسا لاختيار هذا المعيار لتقييم الفهارس المتاحة 
على الخط المباشر. 


وتحدد نقاط الوصول كيف يمكن البحث في معلومات الفهارس المتاحة على 
الخط المباشرء وتشكل معيارا آخر لتقييم هذا الشكل من الفهارس؛ ففي السنوات 
المبكرة لتطور هذه الفهارس (أي ثانينيات القرن العشرين) كان اسم المؤلف» 
والعنوان» ورقم الاستدعاء «call number‏ والرقم المعياري الدولي للكتاب 
International Standard Book Number (ISBN)‏ والر قم المعياري الدولي 
للدورية «International Standard Serial Number (ISSN)‏ هي نقاط 
الوصول المألوفة. ثم أضيفت الكلمات المفتاحية؛ ورؤوس الموضوعات بعد ذلك. 
ومن الناحية النظريةء فإنه كلما زاد عدد نقاط الوصول التي يكفلها الفهرس المتاح على 
الخط المباشر» كان من الأيسر على المستفيد العثور على المعلومات في النظام» إلا أن 
بعض نقاط الوصول (كالرقم المعياري الدولي للكتاب ISBN‏ ورؤوس الموضوعات 
على سبيل المثال) لا تستخدم بكثافة» OY‏ المستفيدين» وخصوصا المبتدئين منهم لا 
يعرفون الكثير عن مضمون هذه النقاط. وفي مقابل WS‏ فإن نقاط الوصول في حد 
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ذاتهاء لم تصبح معيارا لتقييم نظم الخط المباشر؛ نظرا OV‏ هناك الكثير من هذه النقاط 
في بيئة الاسترجاع ode‏ ومن الممكن اختيار البحث بالحقل» ضمن مقومات البحث» 
بدلا منهاء لتغطية البعد الخاص بنقاط الوصول. 

وتختلف خواص الببحث في الفهارس المتاحة على الخط المباشرء من نظام لآخر. 
وعندما يتم تقييم الفهارس المتاحة على الخط المباشر» من منظور خواص البحث» تتم 
مراعاة عناصر متعددة؛ أوطا أي أنواع مقومات البحث تحظى بالدعم؟ هل جميع 
المعاملات البولينية الثلاثة متاحة؟ ماذا عن البحث بالبترء والبحث بالتقارب؟ ثانياء 
هل يكفل النظام أي خواص تتصل بالبحث» كقائمة رؤوس الموضوعات» على Jed‏ 
المباشزء والإحالات» ومقترحات الارتفاع بمستوى عمليات الببحث» على سبيل 
المثال؟ ثالثاء هل يمكن للمستفيدين تحديد عمليات بحثهم بسنة النشرء أو نوع 
الوثيقة» أو ما شابه ذلك؟ وكلما زادت الخيارات التي يمكن للنظام دعمها OLS‏ 
النظام أفضل. 

ويتم اختيار خواص العرض» وهي مفهوم أعرض من خيارات المخرجات» 
كمقياس لتقييم الفهارس المتاحة على الخط المباشر. ومن الممكن تحليل هذا المعيار إلى 
طول التسجيلة (أي العرض الموجز أو الكامل على سبيل المثال)؛ وعدد التسجيلات 
في كل قائمة» والخواص الأخرى المتصلة بالعرض. كذلك يمكن عرض التسجيلات 
كاملة بصيغ مارك MARC‏ وهذه خاصية تستخدم في معظم الأحيان» من جانب 
اختصاصيي المعلومات. وقد طرح أورورك (1987) O'Rourke‏ المزيد من الأسئلة 
المحددة لاختبار جودة عرض الفهرس المتاح على الخط المباشر. فهل يمكن على سبيل 
المثال» للنظام أن يعرض تلقائيا التسجيلة عندما تكون هي الإجابة الوحيدة المصطلح 
البحث؟ هل التيجان (مثل TH‏ للعنوان» على سبيل المثال) واضحة في حد ذاتهاء في 
حالات العرض المميزة للتسجيلات؟ هل تخلو حالات عرض التسجيلات من 
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.المختصرات. col SV y‏ والمصطلحات الخاصة؟ وفضلا عن AUS‏ يمكن توجيه أسئلة 
حول نوع الحرف وأسلوبه وحجمه أو أشكال الحروف وأحجامها المستخدمةء في 
حالات عرض نتائج البحث في الفهرس المتاح على الخط المباشر. فلا يوصي على سبيل 
المثال JS‏ أحجام الحروف الكبيرة» وأنواع الحروف الصغيرة (كبنط ٠١‏ مثلا) على 
سبيل المثالء لعرض البيانات في الفهارس المتاحة على الخط المباشر. 

وتشكل مساعدة المستفيد معيارا آخر لتقييم الفهارس المتاحة على الخط المباشر. 
وكل| ازدادت المساعدة التي يمكن للنظام تقديمها للمستفيد» تراجعت احتالاات 
شعور المستفيد بأنه لا حول له ولا طول» عندما يتفاعل مع الفهرس المتاح على LI‏ 
المباشر. ومن الممكن تصميم مقومات كثيرة لمساعدة المستفيدين من هذا الشكل من 
الفهارس. وتشمل الأمثلة رسالة تمهيدية تصف الفهرس المتاح على الخط المباشر بوجه 
عام وقائمة بالملفات التي يمكن الوصول إليها أو الحقول القابلة للبحث» وتفسيرات 
رسائل الخطأء والتوعية على الخط المباشر» والمساعدة المتصلة بعملية بحث بعينها على 
الخط المباشر. كذلك ينبغي مراجعة الفهرس المتاح على الخط المباشر أيضاء لمعرفة ما 
إذا كان بإمكانه بيان الخلفية التاريخية للبحث» على سبيل SLAM‏ وما إذا كان يقدم 
تعقيبات إجرائية أو إرشادية بشكل روتيني. ولا ينبغي وضع أي افتراضات حول 
تآلف المستفيد مع النظام» عند مناقشة مساعدة المستفيد. وينبغي أن تكون رسائل 
المساعدة واضحة وبسيطة ودقيقة. 

وقد تطورت معايير التقييم الخمسة هذه في ثانينيات القرن العشرين» عندما 
بدأ استخدام الفهارس المتاحة على الخط المباشر في المكتبات. وقد تم إدخال تحسينات 
وخواص جديدة» ينبغي أن توضع في الحسبان في تقييم الطبعات الحديثة من الفهارس 
المتاحة على الخط المباشر» وخصوصا الجيل الناشئ. فمعظم الفهارس المتاحة على Lli‏ 
المباشر متشابكة الآنء على سبيل المثال» بحيث تكفل التعامل عن okey‏ من المنزل أو 
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المكتب أو أي أماكن أخرى خلاف المكتبة» فهل التعامل عن بعد ملائم؟ هل تتوافر 
أشكال دعم ملائمة لمساعدة المستفيد في التعامل عن بعد؟ ومن ناحية أخرىء فإنه كا 
بينا في M/A‏ يقوم عدد كبير من الفهارس المتاحة على الخط SUL‏ الآن» مقام بوابات 
لمصادر معلومات ونظم أخرى لاسترجاع المعلومات. ف المقومات المتاحة 
للمستفيدين للإفادة من هذه الخاصية؟ وينبغي أن تحظى هذه الخواص والتطورات 
الجديدة للفهارس المتاحة على الخط المباشر بالاهتمام لأغراض التقييم» بالإضافة إلى 
المعايير الخمسة التي تناولناها في هذا السياق. 

ولقد اكتسب ما يسمى بالجيل التالي من الفهارس المتاحة على الخط المباشر 
فعلاء خواص جديدة لم تتوافر في الطبعات المبكرة من هذه الفهارس. وتشمل نم اذج 
مثل هذه الخواص التلقيم المرتد الخاص بالصلاحية» وترتيب نتائج عمليات البحث 
Lab‏ والبيئة المعدلة للتصفح» ومراجعة هجاء استفسارات البحث (Antelman,‏ 
.Lynema & Pace, 2006; Markey, 2007)‏ ويتم إجراء تقييم الجيل dhil‏ من 
الفهارس المتاحة على الخط المباشر» الآن في فعظم الأحيانء عند تقييم الفهرس الماح 
على الخط المباشر حديث النشأة (راجع على سبيل Antebman, Lynema & JUHI‏ 
(Pace, 2006; Lombardo & Condic, 2000‏ »ومع ذلك فإنه م يوضع بعد إطار 
جديد لهذا الفرص. إلا أن هذا الموقف سوف يتغير ولاشك» نتيجة لتطبيق المزيد من 
خواص الجيل التالي من الفهارس المتاحة على الخط المباشرء وخصوصا عندما أعرب 
كثيرون (مثل» 2007 (Marcum, 2006; Markey,‏ فعلا عن غاوفھم بشأن مصير 
هذا النوع من الفهارس في ظل جوجل العملاق. 
معايبر تقييم نظم استرجاع الإنترنت: 


تناول عدد قليل نسبيا من مشروعات التقييم» نظم استرجاع الإنترنت» أحدث 
الأعضاء في أسرة نظم استرجاع المعلومات» على الرغم من أن بعض الباحثين (مشل 
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Chu & Rosenthal, 1996; Ding & Marchionini, 1996; Leighton, 
حاولوا اختبار أداء استر جاع هذه الفئة‎ (1995; Leighton & Srivastava, 1999 
أداء الاسترجاع يمثل جانبا واحدا فقط لنظم استرجاع‎ OLS من النظم. ولما‎ 
ع أيضافي‎ jol المعلومات» فإن الأبعاد الأخرى لنظم استرجاع الإنترنت ينبغي‎ 
الحسبان في التقييم.‎ 

وقد اقترحت تشو وروزنتال )1996( Chu and Rosenthal‏ إطار تقييم 
لحركات بحث العتكبوتية العالمية» النوع الغالب لنظم استرجاع الإنترنت» حتى 
وقت تأليف هذا الكتاب. وهذا الإطار مشتق من معايير تقييم سبعينيات القرن 
العشرين» التي وضعها لانكستر وفاين )1973( Lancaster and Fayen‏ لنظم 
الخط المباشرء مع إضافات ومراجعات مصممة خصوصًا لنظم استرجاع الإنترنت. 
ونظرا للتغيرات التي طرأت على نظم استرجاع الإنترنت بوجه عام» تجاوز الزمن الآن 
بعض الجوانب المحددة في معايير التقييم الشاملة الخمسة (أي تكوين كشافات 
العنكبوتية» وقدرات البحث» وأداء الاسترجاع» والمخرجات» وجهد المستفيد) وقت 
إجراء الدراسةء إلا أن الإطار النظري لا يزال صا حا لتقييم نظم استرجاع الإنترنت. 

وتكوين الكشافات في نظام استرجاع المعلومات» عنصر مهم للتقييم؛ نظرا لأن 
محتوى الكشافات يحدد كيف يمكن استرجاع ما يشتمل عليه النظام من معلومات. 
oo eect dea Webi, US‏ اهال اة كعات ل 
وليس صفحات العنكبوتية نفسهاء هو ما تتم مراجعته لاسترجاع المعلومات. 
والتغطية» وتتابع Loe!‏ وقطاعات وثائق الإنترنت المكشفة (كالعنوان بالإضافة إلى 
السطور الأولى» أو الوثيقة برمتهاء على سبيل المثال) هي العناصر الثلائة التي يتم 
اختبارها. [ey‏ يتوقف مدى المكونات الثلاثة إلى حد بعيد» على طاقة العتاد ومدى 
تطوره» والبرمجيات التي تدير الكشاف أو مرصد البيانات» فإن التغطية الضخمة» 
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والتجديدات المتتابعة» وتكشيف النصوص الكاملة» ليس من الضروري أن تسفر عن 
نظم لاسترجاع الإنترنت» أفضل من المقاييس الأخرى؛ فهناك عوامل أخرى 
(كواجهة التعامل ومقومات البحث عن سبيل (JON‏ تنهض بدور في جودة نظم 
eee‏ الإنترنت. 
وتشكل مقومات البحث معيارا آخر لتقييم نظم استرجاع الإنترنت؛ نظرا OY‏ 
الاختلاف هو القاعدة وليس الاستثناء في هذه الحالة. ومقومات البحث الأساس 
والمألوفة قد لا تكون موجودة في معظم نظم استرجاع الإنترنت. ومن ناحية أخرى» 
فإن مقومات الاسترجاع (كالبحث المشوش على سبيل المثال) التي كان من الممكن أن 
نجدها فقط في المختبرات في الماضي» تطبق الآن في بعض نظم استرجاع الإنترنت. 
“فنظام استرجاع الإنترنت الكفء ينبغي أن يتضمن مقومات البحث الأساس» sl‏ 
ألفها المستفيدون» وتشمل المنطق البوليني» والبحث بالعبارات» وإمكانية التحديد 
(كالتحديد بالحقل على سبيل المثال). ولا كانت مقومات البحث في نظام استرجاع 
الإنترنت» هي التي تتحكم في أدائه في النهاية» فإن من شأن غياب هذه المهام الأساس 
أن تعوق النظام بشدة. 
وعادة ما يتم تقييم أداء الاسترجاع بثلاثة معايير؛ هي التحقيق» والاستدعاء 
وزمن الاستجابة. وبينا يمكن قياس هذه المتغيرات الثلاثة جميعا بطريقة كمية» فإنه 
ينبغي مراعاة المزيد من الحيطة والحذرء عندما يكون المرء بصدد الحكم على صلاحية 
ا لمواد المسترجعة؛ وتقدير إجمالي عدد الوثائق الصا حة لموضوع بعينه» في نظام قائم على 
شبكة. ونظرا ON‏ تمثيلات أو بدائل وثائق الإنترنت (كالملخصات أو الاقتباسات على 
سبيل (JEM‏ يتم إعدادها بوسائل آلية في غالب الأخيان» فإن أحكام الصلاحية 
القائمة على مثل هذه التمثيلات» يمكن أن تسبب المزيد من المخاوف بشأن إمكانية 
التعويل عليها. يضاف إلى ذلك أن الطابع الديناميكي المتقلب للإنترنت يجعل من 


ee 


الصعب تقريباء تحديد Sle]‏ عدد الوثائق الصالحة في نظام لاسترجاع الإنترنت. ومن 
ثم» فإن حساب الاستدعاء أصعب في بيئة الإنترنت» ما هو عليه في الأنواع الأخرى 
من نظم jul‏ جاع المعلومات. إلا أن أوبنهايم ورفاقه )2000( Oppenheim, et al.‏ 
يرون أن الاستدعاء النسبي يمكن حسابه باتباع الطريقة التي اقترحها كلارك وويليت 
Lils Lae Clarke and Willett (1997)‏ بصدد تقييم أداء نظم استر جاع 
الإنترنت. وفيا يتعلق بزمن الاستجابة كأحد عوامل الأداء» فإنه في سبيله لأن تتراجع 
أعميته نظرا OV‏ نظم اسنترجاع الإنترنت تزداد تحسنا من حيث طاقة التجهيز. 


وينبغي النظر في المخرجات كمعيار للتقييم بالنسبة لنظم استرجاع الإنترنت» 
وذلك من ثلاث زواياء هي إمكانية الوصول أو التعامل» والمحتوى» والشكل. 
وبفضل خاصية الروابط الفائقة» يستطيع المستفيد الوصول إلى الوثاتق الكاملة لناتج 
الاسترجاعء إذا كانت الروابط تعمل على النحو السليم. إلا أن هناك روابط Ae‏ 
كالروابط المنقطعة (كالروابط بالمواقع التي تغيرت المحددات الموحدة لأماكن المصادر 
URLs‏ اللخاصة cle‏ على سبيل COL‏ أو الروابط الميتة (كالروابط بالمواقع التي لم تعد 
متاحة» على سبيل المثال). وينبغي للنظام المثالي لاسترجاع الإنترنت» أن fat‏ عدد 
الروابط المختلة في حده الأدنى» وبذلك يكفل الحد الأقصى لإمكانية الوصول للنتائج 
النهائية. ويتحدد محتوى المخرجات» إلى حد ماء تبعاً للطريقة التي بني بها نظام 
استرجاع الإنترنت؛ أي ما إذا كان النظام يقتطف مجرد اقتطاف» أم يكشف فعلا ما 
يتضمنه عند بناء مرصد بياناته؟ وينبغي أن تكون الإجابة واضحة؛ فالمقتطفات لا 
تكفل مساعدة تذكر للمستفيد في تحديد موضوع أو +5 aboutness“‏ النتتائج 
المسترجعة. وهناك جانب آخر يتصل بمحتوى المخرجات» وهو مقدار التكرار في 
التتائج. ولا يستطيع سوى بعض ما وراء نظم استرجاع الإنترنت» في الوقت الراهن» 
التخلص من المكررات. إلا أن المخاوف بشأن أشكال مخرجات نظم استرجاع 
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الإنترنت» قلا AF‏ قضية ة تذكر؛ نظرا OV‏ النظم تميل OY‏ تحدد سلفا جميع أشكال 
المخرجات المحتملة» ومن الممكن الاطلاع على الوثائق؛ الأصلية التي تمثلها 
المخرجات بسهولة إذا رغب المستفيد في ذلك» ومن ثم» فإن إمكانية الوصول 
والمحتوى هما خاصتا المخرجات الفريدتان والمهمتان, بالنسبة لتقييم نظم 
استرجاع الإنترنت. 

ويدل جهد المستفيد في السياق الراهنء على التوثيق وواجهة التعامل؛ نظرا OY‏ 
هذين العاملين يؤثران على نحو جوهري في جهود المستفيدين» في الإلمام بنظم 
استرجاع الإنترنت» والإفادة منها؛ فالتوثيق المعد جيداء وواجهة التعامل التي 
تتعاطف مع المستفيد» ينهضان بدور لا يستهان به في اختيارات المستفيدين لنظم 
استرجاع الإنترنت. وعلى عكس الأنواع الأخرى لنظم استرجاع المعلومات» فإن نظم 
استرجاع الإنترنت مجانية بوجه عام» ولا تبدو أوجه التمييز Led‏ بينها واضحة» ومن ثم 
فإن جاذبية أي من نظم استرجاع الإنترنت» يتم التعبير عنها للمستفيدين» عن طريق 
واجهة التعامل والتوثيق في المقام الأول. وبعبارة أخرى» فإن المستفيدين لن يقع 
اختيارهم على نظام لاسترجاع الإنترنت» مالم يكونوا يشعرون بالراحة مع واجهة 
التعامل الخاصة به» وما لم يكونوا قادرين على قراءة واستيعاب توثيقه عندما 
يستشيرونه. وقد حاولت نظم استرجاع الإنترنت كفئة» الحد من جهود المستفيدين» 
بتطبيق أسلوب تعبئة الاستهارات» والطرق التصويرية للتفاعل» ويشوفير مقومات 
المساعدة على الخط المباشر. وعند تقييم نظم استرجاع الإنترنت من وجهة نظر جهد 
المستفيد» فإن المرء بحاجة لأن يختبر» على وجه المخنصوص. ما إذا كانت الشاشة مزدحمة 
جداء أو ما إذا كانت رسائل المساعدة مغرقة في التقنية أو الإيجاز؛ نظرا OY‏ مثل هذه 
المخاوف تبدو عادية بالنسبة لبعض النظم. ومن ناحية أخرى» يختلف المستفيدون من 
نظم استرجاع الإنترنت» عن IS gl‏ الذين يفيدون من النظم الأخرى لاسترجاع 
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المعلومات. فهم أكثر الفئات تنوعا من حيث مهارات وخبرات استرجاع المعلومات. 
وقد لا يكونون قد تلقوا أي شكل من التدريب قبل التعامل مع نظم استرجاع 
الإنترنت فعلا. يضاف إلى ذلك أنه قلا يكون هناك عادة وسيطء كما في حالة نظم 
الخط المباشرء ليقوم بإجراء عملية البحث للمستفيد. ويفرض غياب الوسيطء وافتقار 
معظم المستفيدين من نظم استرجاع الإنترنت إلى الخبرة» شرطا بالنسبة للحد من جهد 
المستفيد» أكثر صرامة ما يتعلق ch‏ بيئة أخرى لاسترجاع المعلومات. 

وفضلا عن معايير التقييم الخمسة التي سلف ذكرهاء ينبغي أيضا وضع 
استرجاع العبارات» والاسترجاع متعدد اللغات» والبحث عبر اللغات» في الحسبان» 
في تقييم نظم استرجاع الإنترنت. وقد شرحنا مفهوم استرجاع المقاطع أو الفقرات في 
٧ 0١‏ قبل مناقشة نظم استرجاع الإنترنت على وجه التحديد. ولما كانت 
العنكبوتية قد أصبحت أحد التطبيقات الجوهرية للإنترنت» وتتخذ وثائق العنكبوتية 
شكل الروابط الفائقة» قإنه يبدو من الضروري» على نحو متزايد» توافر مقومات 
استرجاع الفقرات أو المقاطع في الإنترنت؛ فالنهج التقليدي لاسترجاع الوثائق ALLS‏ 
لا يكفل مساعدة تذكر بالنسبة للمستفيد من نظم استرجاع الإنترنت. في تحديد 
المعلومات التي تدعو الحاجة إليها؛ ويرجع ذلك إلى حد ما إلى البنيان الفائق لوثائق 
العنكبوتية. فمن الممكن لمقطع أو فقرة المعلومات المرغوب فيهء أن يكون مطموراً في 
أعماق البنيان» كا أن الحجم غير العادي لبعض وثائق العنكبوتية» يعد مشكلة في حد 
ذاته. ولهذا السبب يبدو استرجاع الفقرات أو المقاطع خاصية مفضلة بالنسبة لنظم 
استرجاع الإنترنت. by‏ عام ۱۹۹۷ء بدأت سلسلة مؤتمرات استرجاع النصوص 
ë ng tll TREC‏ مشروع بحث حول استرجاع الفقرات سمي مسار الرد على الأسئلة 
.(Voorhess, 2000) Question Answering‏ 
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ويتعلق الاسترجاع متعدد اللغات» أو البحث عبر اللخات» الذي نوقش في 
١4‏ بالبعد اللغوي لنظم استرجاع المعلومات. (Sy‏ عولحت في الفصل التاسع» فإن 
المعلومات باللغات غير الإنجليزية؛ يتم تحميلهاء على نحو متزايد» على الإنترنت» بم 
يوحي Ob‏ عامل اللغة في سبيله OY‏ يصبح متزايد الأهمية» بالنسبة لنظم استرجاع 
الإنترنت. وتتضمن أنواع أخرى من نظم استرجاع ا معلومات» معلومات متعددة 
اللغات» إلا أا لا تقترب إلى مستوى يمكن مقارنته بمستوى نظم استرجاع 
ال اة A‏ رن ع E Gabe‏ يلون ا و الله من 
Sle!‏ المتعاملين مع الإإنترنت» في يونيو عام (Miniwatts Marketing ٠٠١١8‏ 
Group, 2009)‏ والعدد في ارتفاع مستمر. ويبدو من المعقول فقط إذن» إدخال 
البعد اللغوي في تقييم نظم استرجاع الإنترنت. وقد تمت دراسة كل من الاسترجاع 
متعدد اللغات» والبحث عبر اللغات في مؤتمرات استرجاع النصوص TREC‏ 
.(Voorhess & Harman, 2000)‏ وقد خص كلاف )2007( Clough‏ الجهود 
التي بذلت في منتدى كلف Image CLEF 5 yal)‏ وهو مسار لمنتدى التقييم عبر 
اللغات .Cross-language evaluation forum (CLEF)‏ نشأ للتقييم واسع 
cull‏ لنظم استرجاع الصور عبر اللغات. وقد ورد وصف منتدى التقييم عبر اللغات 
CLEF‏ في 4/\/¥. 

ويتصل كل من استرجاع المقاطع أو الفقرات «passage retrieval‏ 
والاسترجاع متعدد اللغات» والبحث عبر اللغات» في الواقع» بمعيار تقييم مقومات 
البحث. إلا أن هذه السبل قد نوقشت بمعزل بعضها عن بعض» في هذه ال حالة؛ لتأكيد 
أهميتهاء وإبراز التغيرات التي طرأت على إطار التقييم الذي اقترحته تشو وروزنتال 
Chu and Rosenthal (1996)‏ لنظم أستر. جاع الإنترنت. 
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وفي ذروة أنشطة التقييم بالنسبة لنظم استرجاع الإنترنت» أشار أوبنهايم 
وآخرون )2000( Oppenheim, et al.‏ إلى وجود قليل من الاطراد lab‏ بين 
الدراسات المتصلة» من حيث معايير أو طرق التقييم المتبعة. وقد أوصوا بتطوير 
مجموعة معيارية من الأدوات اللازمة لعمليات التقييم في المستقبل» كما قدموا أيضا 
بعض المقترحات المبدئية حول ما ينبغي أن تتضمنه هذه المجموعة المعيارية من 
الأدوات. ولما كانت نظم استرجاع الإنترنت» هي أسرع الأنواع نموا في أسرة نظم 
استرجاع اا الأوان لتجديد جهودنا البحثية في تقييم هذه النظم» 
لدعم مسيرة تقدمها ونموها. 


معابير تقييم نظم الاسترجاع متعددة الوسائط: 

ناقشنا استرجاع المعلومات متعددة الوسائط في ۹/ ۲ء تحت العناوين الفرعية 
'استرجاع الصور الثابتة" وٌاسترجاع الأصوات» و"استرجاع الصور المتحركة . 
وتشهد جهود البحث والتطوير في هذا المجال توسعا سريعاء مسايرة لنضج التقنيات 
المتصلة به. ونتيجة لذلك أصبح الآن هناك عدد لا بأس به من نظم الاسترجاع 
الخاصة بالمعلومات متعددة الوسائط. في متناول المستفيدين. وقد لوحظت الحاجة إلى 
تقييم مثل هذه النظم الخاصة بمعلومات الوسائط المتعددة» من جانب الباحثين في 
المجال. وي التقرير الذي أعده ترانت )2004( Jus Trant‏ مسارات ترك TREC‏ 
الخاصة باسترجاع الوثائق الناطقة TREC tracks SDR (Spoken Document‏ 
Retrieval)‏ والفيديو (التي سبقها عام ٠٠١”‏ تركفيد TRECVid; ww-‏ 
«(nlpir.nist.gov/projects/trecvid‏ بالإضافة إلى مشروعات مثل إميجكلف 


«(imaglclef.org) Image CLEF‏ تدل جميعها على ضرورة تقييم استرجاع 
المعلومات متعددة الوسائط. 
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وعلى عكس تقييم استرجاع المعلومات النصيةء الذي تراكمت محاولاته على 
مدى خمسين عاما من rgd‏ والخبرة (مثل تجارب كرانفيلد Cranfield‏ الرائدة) Y‏ 
يبدو هناك سوى قليل من الباحثين الحريصين على محاولة تقييم استرجاع المعلومات 
متعددة الوسائط. ويفسر هذا العزوفء. إلى حد ماء لما بدأ مجلس موارد المكتبات 
والمعلومات Council on Library and Information resources‏ وكذلك 
اتحاد المعلومات المتشابكة LAYS 5 «Coalition for Networked Information‏ 
في الولايات المتحدة الأمريكية» مشروعا Gi,‏ لتطوير خدمات مرصد بيانات 
استرشادي لاسترجاع الصور )2004 (Trant,‏ والتجارب الفردية لاختبار نظم 
بعينها لاسترجاع المعلومات متعددة الوسائط مألوفة (راجع على سبيل المثال Chang,‏ 
Deselaers, Keysers & Ney, 2008‏ ;2002( في الوقت الذي غالبا ما كانت 
تصمم فيه دراسات أخرى» لمقارنة الح pill!‏ غل الاخترى لاست جاع La glall‏ 
متعددة الوسائط» مقابل النهج القائم على الوصف (راجع على سبيل Petrelli JUL‏ 
Auld, 2008‏ &) وما لا يزال غائبا في هذا المجال الخاص ببحوث التقييم» هو 
الإطارء أو مجموعة المعايير التي يمكن أن تطبق للحكم على جودة نظم استرجاع 
المعلومات متعددة الوسائط» فأداء الاسترجاع فقط» على سبيل المثال» هو الذي يقاس 
بمعايير تقليدية كالتحقيق والاستدعاء» حتى في مسار ترك الخاص بالفيديو 
(Smeaton & Over, 2003) TREC Video track‏ وماتلاه تركفيد 
(Smeaton, 2007) TRECVID‏ ولا يزال هناك بعض الجوانب الأخرى لنظم 
استرجاع معلومات الوسائط ated‏ التي لم تخضع للاختبار في جهود التقييم. 

وقد وض عالباحثون في استر جاع المعلومات الموسيقية (MIR)‏ 
وهو قسم واضح المعا م في استرجاع المعلومات متعددة الوسائط» منصتهم 
الخاصة بالتقييم» وذلك على غرار الإطار الأساس لمؤتمرات استرجاع النصوص 
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J على الوثائو ئق التي جمعها داو‎ elus. (Downie, 2003) TREC paradigm 
لا يزال في المرحلة‎ MIR فإن تقييم استرجاع المعلومات الموسيقية‎ Downie (2004) 
RSIS aT 
للموضوع» دون إجراء أي تقييم فعلي. وبعبارة أخرى» لا تزال هناك حاجة لعمل‎ 
الكثير لسد فراغ تقييم استرجاع المعلومات الموسيقية على وجه الخصوص. وتقييم‎ 
استرجاع المعلومات متعددة الوسائط بوجه عام.‎ 


القابلية للإفادة معيارا للتقييم: 

القابلية للإفادة usability‏ مصطلح تم سكه منذ عهد قريب نسبياء ليحل محل 
عبارة التعاطف مع المستفيد cuser-friendliness‏ التي جرت العادة على أن تكون 
الكلمة المفتاحية» التي عادة ما نجدها في سياق تفاعل الإنسان مع الحاسب (Rowley‏ 
Hartley, 2008)‏ &« على الرغم من إمكان تتبع جذوره في قانون مورز Mooers‏ 
law‏ لنظم استرجاع المعلومات» الذي اقترح عام ١47٠‏ (راجع ۳/۲/٠/١‏ في هذا 
الكتاب). ووفقهاللمنظمة الدولية للتوحيد القيامى International‏ 
Organization for Standardization (ISO, 1998)‏ فإن القابلية للإفادة تعرف 
بوصفها” GAL‏ الذي يمكن به الإفادة من منتج cle‏ من جانب مستفيدين محددين» 
لتحقيق أهداف douse‏ بفاعلية» وكفاءة» وقناعة أو ارتياح» في سياق معين للإفادة . 

وتوضح هذه المواصفة المعيارية الخاصة بالأيزو TSO‏ كيف يمكن التحقق من 
المعلومات اللازمة OY‏ توضع في الحسبان» عند التحقق من القابلية للإفادة أو تقييمهاء 
من حيث أداء المنتج ورضاء المستفيد )2001 (Bevan,‏ ومن ناحية أخرى» يقدم 
جاكوب نيلسن Jakob Nielsen‏ الذي حقق إسهامات مهمة لنشر القابلية للؤإفادة 
كنهج بديل لتقييم مواقع العنكبوتية - يقدم تعريفا بسيطاً للقابلية للإفادة:”القابلية 
للإفادة ... إنما هي في الأساس قضية ما إذا كان النظام صا حا ب| فيه الكفاية لتلبية جميع 
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المستفيدين والمديرين )24 P.‏ ,1993( 
وما لاشك فيه أن كلا من تعريف الأيزو TSO‏ وتعريف نيلسن ينطويان على 
gles‏ أكثر اتساعاء [ey‏ تدل القابلية للإفاذة» في Sle‏ تنظيم المعلومات واسترجاعهاء 
في الأساسء على تقييم أداء نظم استرجاع المعلومات ورضاء المستفيد. وعلى هذا 
النحوء فإن القابلية للإفادة ليست مقياسا واحدًا لتقييم نظم استرجاع المعلومات» وإنا 
تشمل مجموعة من المعايير الخاصة بأهداف التقييم. ويقترح نيلسن ,1993( Nielsen‏ 
)2003 الخصائص الخمس التالية للقابلية للإفادة الجيدة: 
٠‏ القابلية للتعلم: ما مدى السهولة بالنسبة للمستفيدين» في إنجاز المهام 
الأساس» التي يواجهونها E‏ النظام لأول مرة؟ 
» الكفاءة: بمجرد أن يلم المستفيدون بالنظام» ما مدى السرعة التي يمكن 
بها إنجاز المهام؟ 
٠.‏ القابلية للتذكر: عندما يرجع | لمستفيدون إلى النظام» بعد فترة من التوقف 
عن الإفادة care‏ ما مدى السهولة التي يمكنهم ا استعادة الكفاءة؟ 
٠‏ الأخطاء: كم عدد الأخطاء التي يرتكبها المستفيدون» وما مدى جسامة 
هذه cele VI‏ وما مدى السهولة التى يمكن بها للمستفيدين التوقف عن 
ارتكاب الأخطاء؟ 
© الرضاء: ما مدى المتعة في الإفادة من النظام؟ 
وتردد هذه العناصر الخمسة بوضوح» صدى النقاط الخمس التي نوقشت في 
٠١‏ ”ف هذا الكتاب. ومن ناحية أخرىء يميل شنايدرمان وبليزانت 
Schneiderman and Plaisant (2005)‏ للنظر إلى مصطلح القابلية للإفادة 
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good interface بوصفه مرادفا للتصميم الجيد لواجهة التعامل‎ usability 
تصميم واجهة المستفيد؛‎ Ke ASI وذلك في الطبعة الرابعة من الكتاب‎ design 
‘Designing the user استراتيجيات للتفاعل الفغال بين الإنسان والحاسب‎ 
interface: Strategies For Effective Human-Computer Interaction 
وقد استخدمت القابلية للإفادة» بصرف النظر عن طريقة تفسير دلالاتماء على نطاق‎ 
واسع» كطريقة لتقييم جودة مختلف نظم امسترجاع المعلومات؛ فقد تم على سبيل‎ 
المثال» إجراء اختبار للقابلية للإفادة» على الفهارس المتاحة على الخط المباشر حديثة‎ 
‘Antelman, Lynema & Pace, 2006; Guha التطبيق (ر اجع على سبيل المثال‎ 
والأنواع الأخرى من نظم استرجاع المعلومات. وفضلا عن‎ »)& Saraf, 2007 
من جانب هيرست‎ (Flamenco تم اختبار إحدى واجهات البحث (فلامنکو‎ abs 
Haga and Kaneda اختبر هاجا وكانيدا‎ |S «Hearst, et al. (2002) وآخرين‎ 
نظاما لاسترجاع الفيديوء من وجهة نظر القابلية للإفادة. وقد أنشئت عدة‎ (2005) 
مختبرات للقابلية للإفادة» منذ نباية العقد الأخير من القرن العشرين»؛ بتجهيزات‎ 
مصممة خصوصًاء وبرمجيات وضعت في فضاء فيزيائي» صممت خصوصًا لذلك‎ 
يتجاوز حدود القابلية‎ cele حتى وإن كان ما تختيره هذه المختبرات بوجه‎ Sd 
للإفادة الخاصة بنظم استرجاع المعلومات.‎ 


مشروعات التقييم الكبرى لتنظيم المعلومات واسترجاعها: 

مضى حوالي نصف قرنء منذ إجراء أول دراسة تقييم في استرجاع المعلومات 
عام .(Lancaster, 1979) ۱۹٥۲‏ وقد تم تنفيذ مشروعات عدة» لتقييم تنظيم 
المعلومات واسترجاعهاء منذ ذلك الحين. وتجارب كرانفيلد (راجع على سبيل SLY‏ 
e(Cleverdon, 1962‏ ومشروع المدلرز MEDLARS‏ (نظام تحليل واسترجاع 
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الإنتاج Í‏ لفكر ي الطبي MEDical Literature Analysis and Retrieval‏ 
(System‏ (راجع على سبيل (Lancaster, 1968 JEL‏ وتجربة سمارت SMART‏ 
نظام idle‏ واسترجاع النصو ص (System for the Manipulation and‏ 
Retrieval of Texts)‏ )3 اجع على سبيل المثال 1981 (Salton,‏ ودراسة ستيرز 
(Storage and Retrieval System) STAIRS‏ (راجع على سبيل Blair & JEI‏ 
(Maron, 5‏ وسلسلة مؤتمرات استرجاع النصوص TREC‏ (راجع على سبيل 
(Harman, 1993; Harman & Voorhess, 2006 JULI‏ نضلا عن بعض 
المشروعات الكبرى في هذه الفئة. ومن بين جميع دراسات التقييم الكبرى» سوف 
نتناول تجارب كرانفيلد» وسلسلة مؤتمرات استرجاع النصوص TREC‏ بالتفصيل؛ 
نظرا لأنهم| الأقوى تأثيرا في تاريخ تقييم تنظيم المعلومات واسترجاعها. كما نناقش 
أيضا المشكلات والقضايا المحيطة بمشروعات تقييم تنظيم المعلومات واسترجاعها. 
تجارب كرانفيلد: 

أجريت تجارب كرانفيلد على مرحلتين» هما كرانفيلد الأولى» وكرانفيلد الثانية» 
بين عامي NAW y 1۹١۷‏ وهما أول مشروعات التقييم المستفيضة» تم تنفيذها 
بقيادة سيريل دبليو. كلفردون C.W. Cleverdon‏ الذي كان in‏ اختصاصيا 
للمكتبات بكلية علوم الطيران بكرانفيلد في انجلتر | College of Aeronautics in‏ 
Canfield, England‏ وعلى الرغم من أن تجارب كرانفيلد كانت تتعلق بتقييم 
الطرق اليدوية لتنظيم المعلومات واسترجاعهاء فإن المنهج الذي ابتكر في المشروع» قد 
استخدم فيا بعد لتقييم الكثير من الطرق الرقمية لتنظيم المعلومات واسترجاعها. 
وغالبا ما تسمى الدراسات المشابهة لتجارب كرانفيلد بالمشروعات الماثلة لكرانفيلد. 
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كرانفيلد الأولى: 

صممت تجارب كرانفيلد الأولى لاختبار الكفاءة النسبية لأربعة نظم 
للتكشيف. في أداء الاسترجاع. في بيئة تنطوي على الكشير من المتغيرات الأخرى» 
كالمكشف» والوثيقة» Atals‏ البحث. وقد استخدم الاستدعاء والتحقيق لقياس 
أداء الاسترجاع في هذا المشروع» كأول تطبيق من هذا النوع» في تجارب واسعة النطاق 
لتقييم تنظيم المعلومات واسترجاعها. يضاف إلى ذلك أنه كان من الممكن حساب 
الاستدعاء في كرانفيلد؛ نظرا OV‏ مجموعات الاختبار التى تكونت خصوصًا 
للمشروع كانت By pat‏ ومعروفة. وكانت نظم التكشيف الأربعة التي وقع عليها 
الاختيار لكرانفيلد الأولى هي: 

(UDC) التصنيف العشري العالمى‎ ٠ 

© فهرس موضوعي هجائي. 

e‏ خطة تصنيف وجهي. 

° نظام المصطلح الواحد للتكشيف الترابطى „coordinate‏ 


تصميم التجربة: 

الخبرات والتآلف مع النظم التي يتم اختبارها؛ فقد كان لدى أحدهم معرفة 
موضوعية» ولدى الآخر خبرة بالتكشيف. بينا أتى الثالث"" من إحدى المكتبات 
العامة مباشرة» ولم يكن لديه معرفة موضوعية أو خبرة في التكشيف. وقد تم الحصول 


(*) قد لا يعلم البعض أن هذا الثالث» هو فردرك ولفرو لانكسترء الذي أصبح Lhe‏ يشار إليه 
بالبنان» في جال استررجاع المعلومات. (المترجم) 
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على مئة وثيقة» موزعة بالتساوي» على المجال العام لعلوم الطيران» والمجال 
التخصص وهو الديناميكا الهوائية عالية السرعة. وطلب من كل مكشف تكشيف كل 
من الوثائق ا ئة هس مرات» وذلك بإنفاق دقيقتين» وأربع دقائق» وثاني دقائق» 
واثنتي عشرة دقيقة» وستة عشر دقيقة» في تكشيف الوثيقة. وكان متوسط عدد 
المداخل الكشفية التي تخصص لكل وثيقة» يتراوح ما بين اثنين وعشرة (Cleverdon,‏ 
(1962. وكانت استفسارات البحث الخاصة بالاختبار”مصنعة إذ يقوم أعضاء من 
خارج المشروع» بفحص كل وثيقة» ثم صياغة الاستفسارات التي يمكن أن تكون . 
هناك وثيقة معينة صا حة بالنسبة لما؛ فنشأ ما مجموعه ٠٠١‏ استفسار للبحث» 
استخدمت في ثلاث دورات لعمليات البحثء لتشکل TEV‏ استفسارا. 

وكانت عمليات البحث تتم بواسطة العاملين بالمشروع في المقام الأول. وقد 
أجريت دورة البحث الأول على المجموعة الأول المكونة من 5٠٠‏ استفساراء كاختبار 
„pretest [3‏ أما دورة البحث الثانية فكانت مصممة للتغلب على المشكلتين اللتين 
تمت مواجهتهها في الاختبار القبل» وذلك باستخدام المجموعة الثانية المكونة من 4٠١‏ 
استفساراء المشتقة من 4*٠‏ سؤالا. وكانت المشكلة الأولى هي إلى أي مدى كان من 
يقوم بإجراء عملية البحث مقتنغا بمواصلة البحث» ex‏ كان من ا معروف أن الوثيقة 
الصالحة كانت في مكان ما بالملف؟ والثانية هي كيف يمكن لمن يقوم بإجراء عملية 
البحث» أن يقرر على وجه التحديد» ما كان يشكل استراتيجية بحث Lake‏ عند 
استعمال مصطلحات بعينها من لغات التكشيف الأربع؟ ثم تم بعد ذلك تحديد نقطة 
توقف بالنسبة لعملية البحث. في الدورة الثانية» وتطلب الأمر إدخال تعديلات على 
استراتيجيات البحث بالنسبة للاستفسارات نفسهاء لتكون هذه الاستراتيجيات 
عامة» وبمصطلحات كل نظام من نظم التكشيف» وذلك على نحو محايد قدر 
الإمكان. وقد كشف تحليل إخفاق النتائج بالنسبة للجولة الثانية» عن حالات نجح 
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البحث فيها في أحد نظم التكشيف» إلا أن الاستفسار نفسه في نظام آخر أخفق نظرا 
لصياغة الاستراتيجية. ومن ثم» صممت دورة ثالثة للبحث باستعمال مجموعة أخرى 
من ٠٠١‏ استفساراء للتخلص من مظاهر التباين بين من يقومون بإجراء عمليات 
البحث واستراتيجيات البحث» وذلك باتباع استراتيجية معيارية ثابتة لكل 
النظم الأربعة. 
نتائج الاختبار: 

كانت أهم نتيجة انتهت إليها كرانفيلد الأولى» هي أن نظام المصطلح ا 
حقق أفضل استدعاء» من بين نظم التكشيف الأربعة المختلفة» التي شملها الاختبار 


(راجع الجدول رقم CV 0١ ١‏ على الرغم من أن جميع النظم حققت مستوى نماثلا في 
كفاءة الأداء )1962 (Cleverdon,‏ 


الجدول رقم Y /١١‏ معدل استدعاء نظم التكشيف الأربعة 


)7/( الاستدعاء‎ 
A.۰ 


المصطلح الواحد 








كذلك كشفت كرانفيلد الأولى عن أن تزايد الوقت المستنفد في التكشيف» أدى 

إلى تزايد الاستدعاء حتى مستوى معين» بعده يمكن للارتباط الإيجابي بين وقت 

التكشيف والاستدعاءء؛ أن يصبح عكسياء كما يتبين في الجدول رقم ٣/١١‏ 
.(Cleverdon, 1962)‏ 
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الحدول رة قم ۳/١١‏ زمن التكشيف في مقابل معدل الاستدعاء 


زمن التكشيف (بالدقيقة) الاستدعاء (/) 








وبين كان المكشفون الثلاثةء ختلفين من حيث خيرة التكشيف والمعرفة 
الموضوعية» فإنه لم يلاحظ اختلاف يذكر في| بينهم» في استرجاعهم للوثائق التي 
كشفوها بأنقسهم» أو في أدائهم في التكشيف. وفضلا عن ذلك فإن معدلات النجاح 
في استرجاع الوثائق حول المجال العام لعلوم الطيران» لوحظ أنها أفضل بنسبة ELL ٤‏ 
للديناميكا ا هوائية عالية السرعة. وتشمل النتائج الأخرى التي أسفرت عنها كرانفيلد 
الأول ما يلى: 

» هناك علاقة تناسب عكسى بين الاستدعاء والتحقيق. 

٣ من الممكن تحقيق زيادة مقدارها واحد بالمئة في التحقيق على حساب فقد‎ ٠ 

٠‏ كانت النظم تعمل بمعدل استدعاء ما بين ۷١‏ بالمئة و30 LAL‏ ومعدل 

تحقيق ما بين ۸ بالمئة و١‏ ؟ بالمئة. 
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ومن بين جميع النتائج التي لخصناها هناء هناك ثلاث تتجاوز التوقعات» وربا 
تتناقض مع بعض الاعتقادات العامة السائدة في أوساط تنظيم المعلومات 
واسترجاعها. وأولى هذه النتائج الثلاث» في| يتعلق بالاستدعاءء أن نظام المصطلح 
الواحد فاق في أدائه BOG‏ نظم للغات المقيدة شملها المشروع؛ على الرغم من الاعتقاد 
النظري بأن اللغة المقيدة تسفر عن أداء استرجاع أفضل من غيرها. وقد أدت هذه 
النتيجة بشكل غير مباشر» إلى الحث على البحث حول التكشيف الآلي» الذي يعتمد 
بقوة على المصطلحات الأحادية أو الكلمات المفتاحية. وثانيهاء تبين أن أداء نظام 
التكشيف بالنسبة للاسترجاع» لا يتوقف على خبرة المكشف أو المعرفة الموضوعية» 
بين| كان الاعتقاد السائد على العكس تاما؛ أى إنه من الممكن لخبرة المكشف ومعرفته 
الموضوعية» أن يساعدا على تحسين الأداء. وثالثهاء تبين من كرانفيلد الأولى أن الزيادة 
في زمن التكشيف. لا يمكن بالضرورة أن تؤدي إلى زيادة الاستدعاء. وعلى العكس» 
كان هناك تناقص في الاستدعاء عندما ارتفع زمن التكشيف من أربع دقائق إلى ثماني 
دقائق (راجع الجدول رقم .)/١١‏ وبين| ارتفع معدل الاستدعاء ثانية» نتيجة لزيادة 
زمن التكشيف» فإن العائد في أداء الاسترجاع لا يبدو متناسبا مع الوقت المستنفد في 
التكشيف؛ فقد ارتفع معدل الاستدعاء» على سبيل JEN‏ بمقدار ٤‏ با مئة فقط (أي من 
۲ بالمثة إلى [ay CALL ۸٤.۳‏ تضاعف الوقت المستنفد في التكشيف أربع مرات 
(أي من أربع دقائق إلى ست عشرة دقيقة). 
كرا نفيلد الثانية: 

لقد صممت تجارب كرانفيلد الثانية لتقييم تأثير مختلف أدوات التكشيف على 
أداء الاسترجاع. وأدوات التكشيف هي التدابير التي يتخذها المكشف للارتفاع 
بمستوى الاستدعاء أو التحقيق. وتشمل أمثلة أدوات التكشيف المترادفات» وعلاقة 
العام بالخاص «coordination b „Ji; generic relations‏ والروابط links‏ 


458 


والأدوار roles‏ وقد وردت المعلومات حول التجارب في تقرير كلفردون عن 
المشر وع )1962 :(Cleverdon,‏ 
لقد انطلقتا من الاعتقاد Ob‏ جميع لغات التكشيف مزيج 
من فئات مختلفة من الأدوات. وتنقسم مشل هذه الأدوات إلى 
فئتين؛ تلك الأدوات التي يقصد بها تحسين معدل الاستتدعاء» 
وتلك التي يقصد بها تحسين معدل التحقيق... وكان هدف 
التجربة دراسة ما يمكن أن يكون لكل من هذه الأدوات» 
منفردة أو في أي تجمع محتمل» من أثر على الاستدعاء 
والتحقيق. )17 (P.‏ 
تصميم التجربة: 
تم تجميع نحو مئتي بحث» JS‏ بحث بوجه ple‏ ما بين خمسة إلى عشرة 
مراجع. ثم طلب بعد ذلك من كل مؤلف أن يبين» في شكل تساؤل بحث» المشكلة 
الرئيسة التي كانت سببا لدراسته» على افتراض أن البحوث قد كتبت نتيجة 
لدراسات أجريت لتقديم إجابات لتساؤل ماء أو عدة تساؤلات في ذهن المؤلف. 
كذلك طلب من كل مؤلف أن يصوغ في حدود BW‏ تساؤلات إضافية» تعبر عن أي 
قضايا فرعية أثيرت أثناء إعداد الدراسة. وبعد ذلك تم الحصول على مستخلصات 
لمراجع هذه البحوث (أي الوثائق المستشهد اء إلى جانب بعض البحوث غير 
المستشهد بهاء التي تم التحقق منها من جانب طلبة الدراسات العليا بالكلية» بناء على 
العناوين» أو عن طريق المزاوجة الوراقية bibliographical coupling‏ (إذ تتزاوج 
وثيقتان وراقيا عندما تشتمل قوائم مراجعه على وثيقة واحدة مشتركة أو أكثر). وقد 
طلب من المؤلفين الكشف عن صلاحية المراجع والبحوث غير المستشهد tle‏ بالنسبة 
لكل تساؤل» على مدرج من واحد إلى خمسة» حيث يدل الواحد على الأكثر صلاحية 
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على الإطلاق» وذلك على افتراض أن المراجع قد سجلت EY‏ ينبغي أن تكون متصلة 
على نحو ماء بموضوع البحث )1963 .(Cleverdon & Mills,‏ وقد تحقق المؤلفون 
من ۱۹١١‏ وثيقة مستشهد بهاء صا حة LIS‏ أو جزئيا للأسئلة التي طرحوهاء البالغ 
عددها ۲۷۹ سؤالاء وقد تم اختيار ١4٠١‏ وثيقة و١۲۲‏ سؤالا من هذه المجموعة؛ في 
النهاية لكر انفيلد الثانية. 


وكانت المجموعة التجريبية المكونة من ١5٠١‏ وثيقة» في المقام الأول في SLE‏ 
الديناميكا امهوائية عالية السرعة وتصميم الطائرات. وقد ”كشفت كل وثيقة بثلاث. 
طرق؛ تم في الأولى اختيار أهم المفاهيم وتسجيلها باللغة الطبيعية للوثيقة» وفي الثانية 
تم تسجيل المصطلحات التي وردت في كل من المفاهيم التي وقع عليها الاختيار» وني 
الثالثة تم الجمع بين المفاهيم بطرق مختلفة؛ لتشكل الموضوعات الرئيسة للوثائق. 
كذلك أعطي لكل مصطلح وزن (أي واحد أو اثنان أو BE‏ حيث واحد هو الأكثر 
أهمية على الإطلاق) وذلك في أثناء عملية التكشيف. للدلالة على أهميته النسبية. وقد 
استخدمت أدوات تكشيف مختلفة أيضا أثناء عملية التكشيف» من أجل استكشاف 
مالحا من تأثير على أداء الاسترجاع. 

وقد تمت عمليات البحث باستخدام مختلف أدوات التكشيف المطبقة 
في ثلاثة أنواع رئيسة للغات التكشيف» وهي OLS‏ تكشيف المصطلح الأحادي؛ 
والمفهوم المفرد» والمصطلح المقيد أو المقنن. وقد وردت المواصفات الخاصة بلغات 
التكشيف هذه» تفصيلا في الشكل رقم CE)‏ والشكل رقم CO)‏ في مقالة كلفردون 
.Cleverdon (1967)‏ كذلك تم اختبار لغات التكشيف المكونة من الكليات 
المفتاحية الواردة بالعناوين والمستخلصات» أيضا في المشروع. وكانت الاستفسارات 
تحلل إلى مصطلحات مفردة» وكانت عملية البحث تتم أولا للبحث عن مضاهاة 
بالنسبة لكل المصطلحات. وكانت المضاهاة تتم بعد ذلك على مستويات ختلفة» 
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وذلك باستبعاد أحد مصطلحات الاستفسار في كل مرة» وبالنسبة لكل ترابط محتمل 
بالمصطلحات المتبقية؛ فبالنسبة لاستفسار به dad‏ مصطلحات مفردة على سبيل JEU‏ 
كانت عملية البحث الأولى تتم بكل المصطلحات الخمسة مجتمعة. وكان من الممكن 
إجراء عملية البحث الثانية بأي من المصطلحات الأربعة من الخمسة؛ باستبعاد 
elles‏ ولعد E ya‏ وعد LU‏ ت NE elas‏ ن المطلعات 
الثلاثة» ثم بأي من المصطلحين. إلى أن يصبح هناك مصطلح واحد للمضاهاة. OLS y‏ 
من الممكن استعمال المترادفات» والمصطلحات الأضيق والمصطلحات caw I‏ 
والمقومات الأخرى» لتحل محل الكلمات الأصلية. وكانت عمليات البحث تتم على 
نحو يكفل المحافظة على ` جميع العوامل ثابتة» فيا عدا عامل واحد متغير. وفي الخال 
السابق» كان عدد المصطلحات الواردة في الاستفسار هو العامل الوحيد المسموح 
بتغيره» بينم كانت تتم المحافظة على جميع العوامل الأخرى ثابتة. وكانت كل من 
التسديدات chits‏ والشوشرة «false drops‏ أي الوثائق غير الصالحة المسترجعة» يتم 
تسجيلها بالنسبة لكل عملية بحث» بحيث يمكن حساب معدلات الاستدعاء 
والتحقيق. 

Oy‏ التصميم برمته» لافتا للنظر نظرا لحجمه» وتنوعه» وتعقده. dy‏ يكن 
الاختبار على أي حال Oger‏ وخصوصا إذا علمنا أنه قد تم إجراؤه يدويا. 


نتائج التجربة: 

لقد تم حساب متوسط معدلات الاستدعاء والتحقيق الخاصة بجميع عمليات 
البحث» في كل لغة من اللغات» واستخدم هذا المتوسط لقياس تأثير أدوات التكشيف 
على أداء الاسترجاع في كرانفيلد الثانية. وقد سجلت التجربة النتائج التالية: 
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٠‏ كانت لغات التكشيف المعتمدة على المصطلحات المفردة» متفوقة من 
حيث cela Y|‏ على أي نوع آخر. 

»ع عندما استخدمت المصطلحات المفردة للتكشيف» أدى إدخال الفغات 
المقابلة» وخصوصا أشباه المترادفات» إلى انخفاض مستوى الأداء. 

O‏ عندما استخدمت المفاهيم للتكشيف» تراجع مستوى الأداء» بإدخال الفئات 
الرئيسة والفرعية والمناظرة» إلى جانب المفاهيم الأصلية. 

٠‏ عندما استخدمت المصطلحات المقيدة للتكشيف» أدى إدخال المصطلخات 
اللأضيق و المصطلحات الأوسع. إلى تراجع مستوى الأداء. 

o‏ كان أداء لغات التكشيفه المشكلة من العناوين» أفضل من أداء تلك 
المشكلة من المستخلصات. 


وكان ما يدعو للعجب فعلاء ولا يمكن تفسيره ببساطة» أنه كما تبين في 
كرانفيلد الثانية» أن أفضل لغات التكشيف أداء» كانت تتكون من SUS‏ مفردة غير 
مقيدة» منتقاة من الوثائق. ولم يكن بإمكان المشاركين في البحث. التوصل إلى 
تفسيرات حو ل هذه المفاجأة )1966 .(Cleverdon, Mills & Keen,‏ وتتطابق هذه 
النتيجة Lad‏ مع إحدى نتائج كرانفيلد الأولى» وهي أن نظام المصطلح الواحد 
uniterm‏ قد تفوق, في أدائه على نظم اللغات المقيدة الثلاثة الأخرىء» التي شملها 
المشروع» من حيث الاستدعاء. وبناء على كرانفيلد الثانية» فإنه يبدو أن المصطلحات 
الأصلية تؤدي ltl‏ على نحو أفضل وحدهاء دون أي تنويعات إضافية 
(كالمصطلحات الأوسع والمصطلحات الأضيق على سبيل المثال). كذلك قدمت 
لغات التكشيف المعتمدة على العناوين» أداء أفضل من أداء اللغات المعتمدة على 
المستخلصات؛ نظرا OY‏ العناوين بوجه عام» أكثر دلالة ودقة من المستخلصات. 
كذلك تأكدت أيضا علاقة التناسب العكسى بين الاستدعاء والتحقيقء في كرانفيلد 
الثانية» عندما أصبحت أدوات التكشيف ie‏ من البيئة التجريبية. 
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مشكلات تجارب كرانفيلد: 

نشر عدد كبير من المراجعات والانتقادات (راجع على سبيل المثال ;1971 Harter,‏ 
iu (Swanson, D.R., 1965, 1971; Vickery, 1966, 1967‏ أجريت تجارب 
كرانفيلد» تشير إلى مختلف المشكلات التي اكتنفت هذه التجارب. وقد صنفت هارتر 
وهيرت )1997( Harter and Hert‏ هذه المشكلات في أربع فئات: الصلاحية وإمكان 
PEESI‏ التعويل validity and reliability‏ والقابلية للتعميم generalizability‏ 
و الفائدة أو الجدوى cusefulness‏ والقضايا النظرية .conceptual issues‏ ونظراً oY‏ 
القضايا النظرية أو المفاهيمية (مشل كيف يمكن تعريف وقياس مفاهيم كالصلاحية 
والرضاء) موجودة في كل مشروعات تقييم تنظيم المعلومات واسترجاعها؛ فإن المناقشة 
التالية سوف تدور فقط حول ثلاث فتات من المشكلات. المدصلة على وجه التحديد 
بتجارب كرانفيلد» وهي الصلاحية وإمكان الاعتاد عليهاء والقابلية للتعميم» 
والقابلية للتطبيق. 

ولقد كانت صلاحية التجارب وقابليتها alee‏ عليهاء موضوعا للتساؤل 
نظرا لعدة حجج؛ فمن الممكن» على سبيل المثال» للوثائق التي قدمت فعلا للمؤلفين 
الذين طرحوا الأسئلةء لتقييم الصلاحية في) يتعلق بالأسئلة المقابلة» أن تكون في 
صالح أساليب مضاهاة المصطلحات البسيطة» على حساب بعض نظم المضاهاة 
المركبة. كا لم تدخل أعداد كبيرة من الوثائق» التي كان من المحتمل أن تكون صا حة 
ولكنها لم تسترجع. في التقييم على الإطلاق. إلا أن النظام لم يحكم عليه سلبا؛ نظرا 
لعدم استرجاع هذه الوثاتق. وكانت هناك أيضا افتراضات ليس لها مايبررهاء أولم 
تخضع للاختبار في التجارب؛ فعلى المرء على سبيل المثال» أن يفترض أن تكون أحكام 
الصلاحية التى صدرت على عدد من الوثائق» بالنسبة لسؤال معين» مناقضة لبعضها 
البعض. قات إن ذلك أن الارتباط بين الوثائق الأصلية والأسئلة» في كرانفيلد 
الثانيةء كان أقوى بكثير ما هو عليه في كرانفيلد الأولى. ويؤثر كل ذلك سلباً في 
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صلاحية تجارب كرانفيلد» وإمكان التعويل عليها؛ أي ما ]13 كانت التجارب قد 
قاست Shed‏ ما كان قد قصد ما قياسه» وما إذا كانت التجارب قابلة للتكرارء إذا ما 
اتبعت الإجراءات نفسها. 

وتبدو نتائج كرانفيلد غير قابلة للتعميم؛ لأنه لم تستخدم العينة العشوائية في 
التجارب. وفضلا عن ذلك» كانت المجموعات التجريبية صغيرة (أي مئة وثيقة في 
الأولى و٠٠4١‏ وثيقة في الثانية) بالمقارنة بالعدد الفعلي للوثائق في نظام ما لاختزان 
المعلومات واسترجاعها. وتبدو بعض النتائج» كما سبق أن بيناء مناقضة للاعتقاد 
العام والخبرة المكتسبة في أوساط تنظيم المعلومات واسترجاعها. وتقف كل هذه 
الحقائق وراء المخاوف بشأن قابلية هذه التجارب للتعميم. 

كذلك تبدو قابلية التجارب للتطبيق في النظم العاملة» موضوع تساؤل» نظرا 
للاصطناعية البادية في عدة أوجه لتجارب كرانفيلد؛ أوها أنه لى تكن هناك مشاركة 
حقيقية للمستفيدين في جميع مراحل التجارب. ثانياء كانت أسئلة البحث مصنعة» ولم 
تكن موجهة من جانب مستفيدين حقيقيين. ثالثاء لم يكن نظام الاختبار نظاما عاملاء 
lily‏ صمم لمجرد إجراء التجارب. وما cab ELEY‏ أنه من المستحيل التحكم في 
متغيرات الاختبار (كعدد المصطلحات التي ترد في الاستفسار» والوقت المستنفد في 
استرجاع الوثائق» على سبيل المثال) التي ينطوي عليها الموقف في نظام عامل فعلا؛ 
ومن ثم» فإن ما تم التوصل إليه في بيئة تجارب كرانفيلد الاصطناعية» قد لا يكون 
قابلا للتطبيق على النظم العاملة لاختزان المعلومات واسترجاعها. 
أهمية تجارب كرانفيلد: 

على الرغم من كل ما وجه من انتقادات» فقد أحدثت تجارب كرانفيلد تأثيرا 
ضخا في كثير من مشروعات التقييم الأخرى» على نحو ما يلي من أوجه؛ أولا تحققت 
تجارب كرانفيلد من العوامل الرئيسة التي تؤثر في أداء نظم الاسترجاع. ولغنات 
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التكشيف وأدوات التكشيف مرد أمثلة هذه العوامل. ثانيا طورت تجارب كرانفيلد» 
لأول مرة منهجا لا يزال متبعاً في مؤتمرات استرجاع النصوص TREC‏ على الرغم 
من عيوبه الكثيرة. ثالثا أثرت تجارب كرانفيلد بوضوح. في نظرتنا لنظم استرجاع 
المعلومات. وكيف ينبغي دراستهاء للا فيه الصالح العام على الإطلاق تقريبا (Sparck‏ 
Jones, 1981)‏ رابعاء مهدت تارب كرانفيلد الطريق نحو أساليب التكشيف الآلي 
الفعالة القابلة للتحقيق؛ نظرا لأنها أثبتت أن نظم المصطلح الواحد واللغة الطبيعية» 
تميل OV‏ يكون أداؤها ماثلاء إن لم يكن أفضل من أداء نظم اللغات المقيدة. 

ولا يمكن المبالغة في أهمية تجارب كرانفيلد» حتى وإن بدت مشكلاتها لا 
يستهان بها. وفيا يتعلق بتقييم نظم اختزان المعلومات واسترجاعهاء OLS‏ جميع 
المشروعات الكبرى»ب] في ذلك سلسلة مؤتمرات استرجاع النصوص TREC‏ تبدو 
متأثرة بطريقة أو أخرى بتجارب كرانفيلد. ولا يمكن لمشروع تقييم واسع المدى 
بعينه» أن يصبح استثناء» في محال تنظيم المعلومات واسترجاعها. وذلك بعينه هو 
السبب وراء سك مصطلح”المشروعات على غرار كرانفيلد Cranfield-like‏ 


"projects 


(*) مما لا شك فيه أن دراسات كرانفيلد قد أرست أسس المنهج التجريبي في جال علم المعلومات. 
راجع فى ذلك: حشمت قاسم. دراسات كرانفيلد وتطور مناهج البحث في علم المعلومات. 
مجلة المكتبات والمعلومات العربية» مج١ءع؛‏ أكتوبر NAAN‏ ص ص 40-49. وأعيد نشر 
هذه المقالة في: 
حشمت قاسم: دراسات فى علم المعلومات» Yb‏ القاهرة» دار غريب» .1۹۹٩‏ ص ص 


)مجرتملا(.154-0١‎ 
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سلسلة مؤتمرات استرحاع النصوص: 

تشكل سلسلة مؤتمرات استرجاع النصوص TREC series‏ استمرارا 
لمؤتمرات كانت تعقد في الولايات المتحدة الأمريكية سنوياء منذ ple‏ ۱۹۹۲ (أي 
ترك (TREC-1 ١-‏ بقصد تحقيق الأهداف التالية: 

٠‏ تشجيع البحث في استرجاع ge pall‏ اعتمادا على مجموعات ضخمة من 
البيانات النصية. 

٠‏ دعم التواصل بين القطاع التطبيقي» والأوساط الأكاديمية» والحكومية» 
بتوفير منتدى منفتح لتبادل أفكار البحوث. 

٠.‏ زيادة سرعة نقل التقنيات من مختيرات البحث إلى المتتجات التجارية» 
باستعراض التحسينات الجوهرية في تقنيات الاسترجاع المتعلقة 
بمشكلات الواقع. 

© التوسع في إتاحة أساليب التقييم الملائمة للاستخدام من جانب القطاع 
التطبيقي» والأوساط الأكاديمية» ly‏ في ذلك تطوير أساليب التقييم الجديدة» 
القابلة أكثر من غيرها للتطبيق على النظم ASL‏ 

وكانت هذه المؤتمرات تحظى بالرعاية المشتركة بين المعهد الوطنى للمواصفات 

National Institute of Standards and Technology المعيارية والتقنيات (نست‎ 
Defense Advanced وجهاز مشروعات بحوث الدفع المتطورة‎ (NIST 
3 و الأجهز ةوالمئؤسسات الأخر‎ Agency (DARPA L ,|s)Research Projects 
Advanced أنشطة البحوث لمتطورة والبحوث والتطوير‎ | te) ذات العلاقة‎ 
وزارة الدفاع‎ Ol psy «Activity (ARDA (أردا‎ Research and Development 
في الولايات المتحدة الأمريكية.‎ (Department of Defense 
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وبنهاية عام cY e A‏ كان قد عقد ۱۷ مؤثمرا TREC 5 pS‏ وعلى الرغم من 
تغير التفصيلات حول سلسلة ترك عبر السنين» كالمشاركين والمسارات (أي 
المشكلات الفرعية في استرجاع المعلومات)؛ ظلت أهداف أكبر جهد في التقييم في 
تاريخ تنظيم المعلومات واسترجاعهاء S‏ هي. 


تصميم سلسلة مؤتمرات استرجاع النصوص: 

سلسلة مؤتمرات استرجاع النصوص TREC series‏ على عكس تجارب 
كرانفيلد» مشروع تقييم مستمر» يضم فرقا مختلفة من المشاركين. وتقوم بعض هذه 
الفرق بتطوير النظم الخاصة بها لاسترجاع المعلومات» [Slog‏ ما تحصل الفرق التي 
تقرر المشاركة في مؤتمر بعينه» على المجموعة التجريبية» والمعلومات المتصلة بهاء التي 
يقدمها رعاة المؤتمر ومنسقو المسارات. ويتم الاسترجاع الفعلي في المقار الخاصة 
بالفرق المشاركة» وتقدم نتائج التقييم المتربعة على القمة للرعاة من أجل التقييم. 
كذلك تجتمع الفرق المشاركة في كل مؤتمر لاسترجاع النصوص., OLY‏ الاختبار 
القبلي pretest‏ لتبادل وجهات النظر والخيرات» ووضع الخطط للمؤتر التالي 
لاسترجاع النصوص. 
الفرق المشاركة: 

تمثل الفرق المشاركة في مؤتمرات استرجاع النصوص (مثل بلكورء جامعة 
كارنيجي ملون (Belcore, Carnegie Mellon University‏ القطاع التطبيقي : 
والأوساط الأكاديمية» والمؤسسات الحكومية في الولايات المتحدة الأمريكية» ومن 
الدول الأخرى أيضا (كالصين وفرنسا على سبيل المثال). وكانت المشاركة في مؤتمرات 
استرجاع النصوص تتم في البداية بالدعوة فقطء إلا أنها الآن متاحة لكل من لديه 
القدرة على المشاركة في المشروع. ويشتمل الجدول رقم 0١‏ على أعداد الفرق 
المشاركة في المؤتمرات التسعة الأولى لاسترجاع النصوص. 


467 


وبإمكان الفرق AS LAL‏ الاختيار من بين ثلاثة مستويات للمشاركة؛ المشاركة 
الكاملةء والمشاركة الكاملة باستخدام ربع مجموعة الوثائق التجريبية ALS‏ 
والمشاركة في التقييم فقط» وذلك لكفالة حماية النظم التجارية لأسرار الخوارزميات 
التي تمتلكها )1995 .(Harman,‏ 


الجدول رقم /١١‏ 4 عدد الفرق المشاركة في مؤتمرات استرجاع النصوص 
المؤتمر الثاني 144۳ 


المؤتمر الغالث 


المؤتمر الرابع 


























الوثائق التجريبية: 


لقد تم تجميع الوثائق التجريبية» في المقام الأول» من الصحف (مثل Wall Street‏ 
(Journal‏ والشبكات الإخبارية te) newswires‏ | شبكة أسيوشيتدبرس الإخبارية 
(Associated Press Newswire‏ وأنواع أخرى من المصادر (مثل السجل الاتحادي 
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(Federal Register‏ وكانت هذه الوثائق تصاغ بشكل موحد بلغة الترميز العامة 
Standard Generalized Markup Language (SGML) i hall‏ وتوزع على 
أسطوانات مكتنزة» سعة كل منها واحد جيجا بايت من البيانات. وقد بدأ المؤتمر الأول 
بأسطوانتين للبيانات التجريبية» ثم ارتفع عدد الأسطوانات المستخدمة في التجارب» في 
النهاية» إلى مس . وتشمل الأسطوانتان ٤‏ وه على بيانات خاصة بالمهمة الخاصة ad hoc‏ 
task‏ التي نتناوطما ف بعد. وتتراوح أطوال الوثائق مابين 550-7٠٠١‏ مصطلح. وعدة 
مئات من الصفحات. وتتكون المجموعة التجريبية من أكثر من مليون وثيقة. 

وقد أدى توسع مؤتمرات استرجاع النصوص في مسارات متعددة» إلى تصميم 
ويناء كثير من مجموعات النصوص المتخصصة. وبالإضافة إلى تلك الوثائق الواردة في 
الجدول رقم 5/ ١‏ في المراجعة العلمية التي أعدها هارمان وفورهيس Harman‏ 
and Voorhees (2006)‏ معت وثائق تجريبية أخر ى» لمسارات كالجينوم 
Genome‏ والجوانب القانونية Legal‏ وبعبارة أخرى» فإن المجموعات التجريبية 
المستخدمة في المسارات الحالية» لم تعد كتلك التي تكونت للمسارات المبكرة» من 
حيث المحتوى والشكل والمجال. 


الموضوعات والاستفسارات: 

لقد كانت الموضوعات7**) الخاصة بالاسترجاع» يكتبها أناس تمن كانوا يفيدون 
فعلا من نظام الاسترجاع» وكانت مهيأة لتحاكي احتياجات المستفيدين الحقيقية. وكانت 
الموضوعات تبنى بإجراء عمليات استرجاع تجريبية» في مقابل عينة من مجموعة 
الوثائق» وبعد ذلك يتم اختيار تلك الموضوعات التي تحرز ما بين ۲١‏ إلى ٠٠١‏ 


(*) الصحيفة اليومية الرسمية للولايات المتحدة الأمريكية. (المترجم) 
(**) تعني هنا الاستفسارات. (المترجم) 
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تسديدة chit‏ على وجه التقريب» في تلك العينة. وكان كل موضوع يصاغ بالطريقة 
المعيارية نفسها (أي بلغة الترميز العامة المعيارية SGML‏ مع رقم تسلسلي» وعنوان 
قصير» ووصف مكون من جملة واحدة» وما ششنابه ذلك)» لكفالة ترتيب آلي أكثر 
سهولة للاستفسارات. وكانت الموضوعات الخمسون نفسهاء تعد لمهمة التوجيه في 
كل مؤتمر من مؤتمرات استرجاع النصوص TREC‏ مع تكوين 5٠‏ موضوعا جديداء 
لكل مؤتمر من أجل المهمة الخاصة. وسوف نوضح بعد قليل ما يقصد بالمهمة الخاصة» 
ومهمة توجيه الاسترجاع الخاصة بمؤتمرات استرجاع النصوص. كذلك OLS‏ يتم 
أيضا إعداد موضوعات للتدريبء DUS‏ تعرف المشاركين على DLL Le pot‏ 
التجريبية. وكانت جودة الموضوعات بالنسبة للمؤتمرين الأول والثاني عالية جداء إلى 
حد أنه كان من الممكن بلوغ مستوى جيد جدا للأداء» دون استعمال استراتيجيات 
التكشيف والبحث المرهقة بلا مبرر؛ ومن ثم فقد تم إعداد الموضوعات» بدءا من 
المؤتمر الثالث فصاعداء واضعين في الحسبان قدرا كبيرا من الواقعية» في الوقت الذي 
كانت تراعي فيه الاهتهامات التشخيصية في التقييم المختبري أو التجريبي (Spärek‏ 
.Jones, 2000)‏ 

وكانت الموضوعات تقدم كبيانات بالاحتياجات» لا كطلبات تقليدية» بناء على 
ثلاثة اعتبارات )28-29 Jsly.(Voorhees & Harman, 2005, pp.‏ هذه 
الاعتبارات أن يكون بإمكان الموضوعات التي تعد في شكل بيانات احتياجات» كفالة 
مدى واسع من طرق صياغة الاستفسارات. أما الاعتبار الثاني فهو أن يكون بإمكان 
الموضوعات بهذا الشكل» توفير المزيد من المعلومات لكل من المسئول عن إجراء 
عملية البحث ومن يقوم بالتقييم» يفيدان منها في إصدار أحكام الصلاحية. والاعتبار 
الثالث» أن يكون بإمكان الموضوعات من هذا النوع» تيسير إعادة استععال المجموعة 
التجريبية نفسهاء في المستقبل» لتجارب مختلفة؛ نظرًا لأن المعلومات التفصيلية التي 
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تتضمنها الموضوعات جزء من المجموعة. ثم يتم بعد ذلك صياغة استفسارات 
الاسترجاعء بناء على الموضوعاتء آليا أو يدويا. وكان من الممكن للطريقة اليدوية أن 
تستخدم بقدر من المساعدة الآلية. وكانت بعض الاستفسارات الخاصة» تصاغ 
باستعمال التلقيم المرتد للصلاحية relevance feedback‏ 
مهام الاسترجاع: 

لقد تم في مؤتمرات استرجاع النصوص TERC‏ اختبار نوعين من مهام 
الاسترجاع» LAs‏ المهمة الخاصة cad hoc‏ والتوجيه routing‏ وكانت المهام الخاصة 
تقابل الاسترجاع الراجع «retrospective‏ آي العثور على كل المعلومات حول 
موضوع معين» بين كانت مهمة الاسترجاع بالتوجيه تضاهي البث الانتقائي 
اللو مات cole glad Joy tall‏ اى امت حد نا buntis‏ 

وبدءا من المؤتمر الرابع» أدخلت de got‏ من مهام الاسترجاع الإضافية» تركز 
كل واحدة منها على مشكلة استرجاع فرعية معينة. وقند أوضحت سبارك جونز 
Spärck Jones (2000)‏ ما يتعلق بالمسارات بصياغة التناظر الملائم التالي: 


من الممكن النظر إلى مؤتمرات استرجاع النصوص برمتهاء على 
الخاصة (ad hoc‏ ومكابح دوارة (المسارات)» ترتبط كل منها 
با لمحور» وتسلم الوطار legen‏ لبعض. ومن الممكن إدخال المكابح 
الجديدة» وتقوية المكابح القائمة» أو نزع المكابح البالية. وبذلك يمكننا 
البحث عن دولاب استرجاع للمعلومات في ترك دائم التحسن» 
وليس بمجرد كوابح أكثر وأفضل فعلاء (Ly‏ بإعادة تصميم المحور 
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ويشتمل الجدول رقم /١١‏ ه على المسارات التي تمت تغطيتهاء بدءا من المؤتمر 
الرابع حتى المؤتمر العاشر» الذي يعرف أيضا بمؤتمر .۲٠٠١‏ والواقع أن مؤتمرات 
استرجاع النصوص. منذئذ كانت تيز بالعام على نحو مطرد (ترك 5٠١7‏ وترك 
4 على سبيل المثال) بدلا من خطة الترقيم السابقة. ويشتمل الجدول رقم 5/١١‏ : 
على المسارات التي تم إجراء التجارب فيهاء من ترك ٠٠١7‏ حتى ترك .۲۰٠۹‏ 
واعترافا بوجود بنية أساس كافية لدعم الباحثين المهتمين بمهام الاسترجاع الراجع» 
توقفت المهمة الخاصة في ترك cA-‏ بحيث أصبح من الممكن تخصيص المزيد من موارد 
ترك لإقامة بنية أساس لتقييم المسارات )2000 .(Voorhees,‏ 1 


الجدول رقم /١١‏ © نظرة عامة على مسارات ترك: ترك ES ee‏ 








(*) نظام للاتصالات اللاسلكية. (المترجم) 
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PEREA 






NLP الطبيعية‎ 


جهاز تشغيل 
الوسائط VLC‏ 











استرجاع 
المعلومات عبر 
اللغات CLIR‏ 










التحقيق المرتفع 


الاستفسا 






5 





ونظرا لاندماج مهمة التوجيه مع مسار التنقية» منذ ترك-۷» أصبحت جميع 


مهام الاسترجاع التي تم استكشافها في مؤتمرات استرجاع النصوصء بدءا من ترك- 
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الجدول رقم 5/1١‏ نظرة عامة على مسارات ترك: ترك ٠٠١7‏ حتى ترك ۲۰۰۹ 


EOE 
ترك‎ x 


ر 7 





a l 





وبحلول عام ٠٠١4‏ كان قد نشأ أكثر من عشرين مساراء الأمر الذي يدل على 
نقاط تركيز بحوث أوساط استرجاع المعلومات في ذلك الوقت. وبين| توقفت بعض 
المسارات» أنشئت مسارات جديدة لدراسة المشكلات الناشئة في استرجاع المعلومات. . 
واعتمادا على النظرات الشاملة» والانطباعات التي حظيت بها مؤتمرات استرجاع 
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النصوص التي عقدت (راجع على سبيل المثال & Harman, 1995; Harman‏ 
Voorhees, 2006; Spirck Jones, 1995, 2000; Voorhess & Harman,‏ 
2005( وفيا يلي وصف موجز لكل مسار» في ترتيب هجائي**: 
© مسار المدونات «Blog track‏ بدأ في مؤتمر 2350١5‏ لاستكشاف سلوكيات 
البحث عن المعلومات» في مجال المدونات. وكان هذا المسار لا يزال جاريا في 
مؤثمر Yeg‏ 
© مسار استرجاع المعلومات الكيميائية «Chemical IR track‏ أحد مسارين 
جدیدین» أضيفا في مؤتمر ۲۰۰۹ (إلى جانب مسار الكيانات (Entity‏ 
ويسعى إلى تطوير وتقييم التقنيات الخاصة بإجراء عمليات البحث واسعة 
المدى» في الوثائق الكيميائيةء با في ذلك البحوث الأكاديمية ويراءات 
الاختراع. والمستفيدون المستهدفون من هذا المسار هم اختصاصيو عمليات 
البحث عن المعلومات» وخصوصا باحثو براءات الاختراع والكيميائيون. 
© مسار التشويش «confusion track‏ وكان يمثل الجهو دالتي تبذل مع 
البيانات المحرفة «corrupted‏ التي يمكن أن تتأتى» على سبيل المثال» نتيجة' 
للتحقق من الأحرف بصريا (OCR)‏ أو المدخلات الناطقة أو المسموعة. 
bby ponds‏ ذلك الطابع أيضا بالبيانات المشوشة أو المحرفة. وقدتم 
تطبيق هذا المسار في المؤتمرين الرابع والخامس» وهو يتصل بالبحث المشوش 
fuzzy‏ الذي نوقش في /١5‏ في هذا الكتاب. 
© مسار استر جاع المعلومات عبر اللغات Cross-Language Information‏ 
(Retrieval (CLIR) track‏ وهو مسار تغطي فيه الوثائق عدة لغات 


(*) وفقاً لأسرائها باللغة الإنجليزية بالطبع. (المترجم) 
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(كالإنجليزية» أو الفرنسية» أو الألمانية» أو الإيطالية على سبيل (JEU‏ وتغطى 
الموضوعات بكل لغة من هذه اللغات. ويركز هذا المسار على استرجاع 
الوثائق بإحدى اللغات المستهدفة» باستعيال موضوعات كتبت بلغة مختلفة. 
كذلك كان المشاركون يجرون أشواطا أحادية اللغة في اللغة المستهدفة لتكون 
بمثابة الحد الأساس أو العتبة. وكان هذا المسار يركز في المؤتمر العاشرء على 
استرجاع الوثائق باستعمال موضوعات بالإنجليزية أو الفرنسية. وقدتم 
تطبيق هذا المسار لآخر مرة في مؤتمر ۲٠٠۳‏ إلا أن المزيد من جهود البحث. 
في هذا الموضوع تواصلت في كلف CLEF‏ (منتدى التقييم عبر اللغات 
«(Cross Language Evaluation Forum‏ والمجموعة التجريبية لنظم 
استرجاع المعلومات بالمعهد الوطني للمعلوماتية National Institute of‏ 
.Informatics' Test Collection for IR Systems (NTCIR)‏ وقد 
تناولنا كلا الموقعين في 4/ /١‏ 7. 

© مسار إدماج مراصد البيانات Database Merging track‏ وقد طبق هذا 
المسار في المؤتمرين الرابع والخامس فقطء ودرس الطرق الخاصة بمعالجحة 
المجموعات غير المتجانسة» كالخروج بترتيب طبقي واحد للوثائق الخاصة 
بالاستفسارات» حين) تكون مجموعات البيانات التي يتم eV‏ 
عليها مشتتة. 

« مسار المشروع Enterprise track‏ الذي بدأ في مؤتمر ۲٠٠۵‏ .يدف 
دراسة البحث عن المشروعات (عندما يكون المستفيد بصدد البحث عن 
بيانات إحدى منظهات» أو في بيئة مؤسساتية)» وتوقف في مؤتمر ۲00۸ . 

0 مسار الكيانات Entity track‏ وهو أحد مسارين جديدين ندا في مؤتمر 
4 وكان هدفه العام إجراء عمليات البحث المتصلة بالكيانات في 
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بيانات العنكبوتية. وتتعلق مهام البحث هذه (كالعثور على الكيانات 
وخصائص الكيانات على سبيل (JA‏ بالاحتياجات المعلوماتية المألوفة» التي 
لم تصبح بعد على غرار عمليات البحث الخاصة عن الوثائق. 

« مسار التنقية Filtering track‏ الذي ينظر إليه بوصفه الشكل”الحقيقي 
لمهمة التوجيه» التي أدمحت مع هذا المسار منذ المؤتمر السابع. ويتعلق مسار 
التنقية pl ll‏ التي تتسم فيها الموضوعات بالثبات» فضلا عن معرفة بعض 
الوثائق الصالحةء إلا أن هناك تدفقاً في الوثائق الجديدة التي تضاف إلى 
النظام. ويتعين على النظام» بالنسبة لكل وثيقة» أن يتخذ قرارا ثنائياء إما 
استرجاع الوثيقة أو تكوين قائمة طبقية. وقد توقف هذاالمسار في مؤتمر 
۳ بعد ثانية أشواط. 

© مسار دراسات الجينوم «Genomics track‏ وكان (2s‏ لاستكشاف مهام 
الاسترجاع. في مجال يبدي اهتاما ببيانات دراسات الجينوم. وقد استمر من 
مؤتمر 7٠٠7‏ حتى مؤتمر ۲۰۰۷. وقد حددت معالم بيانات دراسات et!‏ 
في هذا المسار» بصورة dale‏ بحيث لا تشمل مجرد سلاسل الجينات فحسب» 
وإنما لدعم التوثيق أيضاء كالأوراق البحثية وتقارير المختبرات» التي تغطي 
مدى واسعا من المعلومات في المجال. 

© مسار الاستر جاع dle‏ الدقة من الوثائق High Accuracy Retrieval‏ 

Documents (HARDدyL_) track from‏ الذي نشا لتحقيق 

الاسترجاع عالي الدقةء بالاستفادة من المعلومات الإضافية حول من يقوم 
بإجراء عمليات البحث» أو حول سياق البحث. وتشمل الأساليب التي 
طبقت في هذا المسار استرجاع المقاطع» و التفاعل المستهدف مع من يقوم 
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بإجراء عمليات البحث. وقد استمر هذا المسار من مؤتمر ۲٠٠۳‏ حتى 
مۇر ,.5٠١0‏ 

مسار التحقيق المرتفع High Precision track‏ الذي اختبر فاعلية وكفاءة 
واجهات المستفيدين الخاصة بالنظم المشاركة في المؤتمرين السادس والسابع. 
وباستخدام مجموعة الخمسين نفسها موضوعاء kS g‏ استخدمت الوثاق في 
المهمة الخاصة» كان يطلب من المستفيد العثور في غضون حمس دقائق» على 
عشر وثائق تيب عن السؤال. ولم يكن بإمكان المستفيدين التعاون معافي 
سؤال واحد» كا م يكن بإمكان النظام أو المستفيد أن تكون لديه معرفة 
مسبقة حول السؤال. ومن ناحية أخرى كانت لدى المستفيد حرية الرجوع 
إلى أي مصدر متاح» مادام زمن الاسترجاع لا يزيد عن الدقائق الخمس. 
المسار التفاعلي Interactive track‏ وهو مهمة خاصة بدراسة تفاعل 
المستفيد مع نظم استرجاع النصوص. وتطوير مناهج لتقييم التفاعل. وكانت 
هذه المهمة» في المؤتمر العاشر» تنطوي على ملاحظة الأفراد الذين يفيدون من 
العنكبوتية الحية» لإنجاز مهام محددة )2002 (Voorhees & Harman,‏ 
وقد طبق هذا المسار لآخر مرة في مؤتمر ٠۲٠٠۲‏ بعد أن أصبح مسارًا في ثانية 
مؤتمرات متتابعة. 

المسار القانوني Legal track‏ الذي بدأ في مؤتمر eY e T‏ ليحاول تطوير 
تقنية بحث تلبي احتياجات المحامين» ومساعدتهم في العثور على المعلومات 
بفاعلية» في مجموعات الوثائق الرقمية. وكان لا يزال جاريا في مؤتمر 9 .7١5١‏ 
مسار المليون استفسار Million Query track‏ الذي بدأ عام eY t eV‏ وهو 
file‏ للاسترجاع الخاص المعياري» ولكن مع اختلاف في التركيز. وقد قصد 
بهذا المسار على وجه التحديد» تقييم أعداد كبيرة من الاستفسارات (ومن هنا 


479 


سمي بالمليون استفسار)» على نحو غير مكتمل» بدلا من عدد قليل من 
الاستفسارات على نحو أكثر اكتمالاء كا كان يتم في المهام الخاصة السابقة 
وظل مسارا في مؤتمر .۲٠٠۹‏ 

المسار متعدد اللغات Multilingual track‏ الذي كان ينظر في قضايا 
الاسترجاع في اللغات غير الإنجليزية. وقد أجري اختبار إسباني تمهيدي في 
المؤتمر الرابع» لیصبح مسارا رسميا في المؤتمر المنامس. كذلك تمت دراسة 
الاسترجاع با لصينية في المؤتمرين الخامس والسادس. وقد تواصل المزيد من 
البحث حول امل المعلومات متعددة اللغات» في منتتدى التقييم عير 
اللغات (كلف (CLEF‏ والمجموعة التجريبية لنظم استرجاع المعلومات 
بالمعهد الوطني للمعلوماتية (NTCIR)‏ اللذين تناولناهما في 4/ TAN‏ 

مسار معالحة اللغة الطبيعية Natural Language Processing (NLP)‏ 
track‏ الذي استكشف. في المؤتمرين الخامس والسادس» ما إذا كانت 
أساليب معالجة اللغة الطبيعية (النظمية syntactic‏ والدلالية (semantic‏ 
المتاحة» ناضجة با فيه الكفاية» ليكون لا تأثيرها على استرجاع المعلومات» 
وما إذا كان بإمكان هذه الأساليب أن تحقق تميزا على طرق الاسترجاع الكمية 
البحث (كالإحصائية مثلا). 


مسار الجحدة Novelty track‏ الذي درس» من مؤتمر ۲٠٠۲‏ حتى مؤمّر 
4 قدرة النظم على العثور على المعلومات الجديدة (أي غير المكررة) 
والصالحة. وقد اعتمد هذا المسار على سين من أسئلة المؤتمرات القديمة 
لاسترجاع النصوصء باستخدام قائمة طبقية ثابتة للوثائق الصا حة المعروفة. 
٠‏ مسار الاستفسار Query track‏ الذي بدأفي المؤتمر السابع» لتشجيع 

الببحث حول تأثير قابلية الاستفسارات للتغير» وتحليل الاستفسارات» على 
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أداء الاسترجاع. وقد قام كل فرد من المشاركين بصياغة عدة أشكال ختلفة» 
من أسئلة مؤتمرات استرجاع النصوصء الموجودة فعلاء مع التركيز» في 
معظم الأحيان» على الأشكال المختلفة للأسئلة بلغات طبيعية مختلفة. ثم 
قامت جميع المجموعات بتطبيق مختلف الصيغ. وقد تحول المسار إلى محطة 
للبحوث" بعد المؤتمر التاسع» وموقع لمؤتمرات استرجاع النصوص على 
العنكبوتية e(trec.nist.gov) TREC website‏ ليكون OV!‏ بمثابة مستودع 
لكل من صيغ الاستفسارات» ونتائج الاسترجاع التي أسفرت عنها 
تلك الاستفسارات. 

مسار الإجابة عن الأسئلة «Question Answering (QA) track‏ الذي 
بدأ في المؤتمر الثامن» لاتخاذ خطوة أكثر اقترابا من Jajal‏ المعلومات (أي 
استرجاع المقاطع) وليس استرجاع الوثائق. ولأغراض أسئلة الاختبار» 
أنتجت النظم مقتطفات نصية تجيب على الأسئلة. وكان للأشواط المختلفة 
حدود مختلفة لأقصى طول للمقتطف» يتراوح بين عبارة موجزة (كلمتان أو 
ثلاث) إلى الوثيقة برمتها (ألف كلمة). وقد أجرى المؤتمر العاشر دراسة 
استرشادية» بأسئلة كانت تتطلب معلومات من وثائق متعددة لتتجمع 
لتشكل إجابة صحيحة )2002 (Voorhees & Harman,‏ وقد توقف هذا 
المسار بعد مؤثمر Vo‏ 

مسار تلقيم الصلاحية المرتد (Relevance Feedback Track‏ الذي يخطط 
لوضع إطار لاستكشاف تأثير العوامل المختلفة على نجاح تلقيم الصلاحية 
المرتد» وهو أسلوب يستخدم على نحو متزايد في استرجاع المعلومات. وقد 
Gab‏ هذا المسار في مؤتمر eY tA‏ وتواصل في مؤتمر Yea‏ 
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مسار الاستر جاع القوي Robust Retrieval track‏ وهو استمرار لمسار 
العنكبوتية Web track‏ انطلق في مؤتمر Ve‏ وكان يشبه مهمة 
الاسترجاع الخاصة التقليدية» إلا أنه كان يركز أكثر على فاعلية السؤال 
الواحد» وعلى نحو أقل» على متوسط الفاعلية. وعلى الرغم من توقف هذا 
المسار بعد مؤتمر 7٠٠6‏ فإن بعض البيانات التي أسفر عنها تستعمل في مهام 
خاصة أخرى. 

مسار البريد المزعج SPAM track‏ الذي بدأ في مؤتمر 2٠٠١6:‏ لإجراء 
تقييم معياري للطرق ال حالية والمقترحة لتقنية البريد من الرسائل المزعجة. كا 
كان من المتوقع أيضا وضع الأساس lad‏ بعد لتقييم المزيد من المهام العامة 
لتنقية البريد الإلكتروني واسترجاعه. وقد توقف هذاالمساربعد 
مؤثمر °۷ . 

مسار استر جاع الوثائق الناطقة Spoken Document Retrieval (SDR)‏ 
track‏ الذي ورث مسار التشويش» ودرس قدرة نظام الاسترجاع على 
استرجاع الوثائق الناطقة (أي التسجيلات والأحاديث). وقد بدأ هذا المسار 
بدعم من جماعة الحديث في المعهد الوطني للمواصفات المعيارية والتقنية 
(نست (NIST‏ وقارن المشاركون فيه فاعلية نظامهم للاسترجاع halet‏ على 
نصوص بشرية للأخبار الإذاعية» ونصوص من إنتاج نظام أساس للتعرف 
على الحديث» واختياريا على نصوص من إنتاج من يتعرفون على الحديث. 
وقد توقف هذا السار في المؤتمر العاشر. 

مسار التيرابايت Terabyte track‏ الذي Gb‏ لأول مرة في.مؤتمر ٤‏ ° *› 
وكان هدفه دراسة ما إذا كان من الممكن» وكيف لأوساط استرجاع 
المعلومات مقارنة التقييم المعتمد على مجموعات تجريبية تقليدية لاسترجاع 
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المعلومات» ومقابل مراصد بيانات أكبر على نحو ملحوظ من تلك 
المستخدمة في مؤتمرات استرجاع النصوص وقتئذ. وقد طبق هذا المسار لآخر 
مرة في مۇتمر Yoel‏ 

مسار الرصيد بالغ الضخامة «Very Large Corpus (VLC) track‏ 
الذي طبق تجريبيا في المؤتمر الخامس» وتوقف بعد ال مؤتمر السابع» وأنجز 
عمليات بحث خاصة على حوالي ٠١‏ جيجا بايت GB‏ 20 من النصوص» 
لاستكشاف فاعلية وكفاءة الاسترجاع. وكان المشاركون فيه يتم تقييمهم بناء 
على Bo‏ استرجاع الوثائق العشرين المتربعة على القمة» وزمن الاستجابة 
بالنسبة للاستفسار» وزمن بناء نظام البيانات» فضلاً عن بعض مقاييس 


٠‏ التكلفة. 


مسار الفيديو Video track‏ الذي استجد في المؤتمر العاشرء وكان يركز على 
التعامل القائم على المحتوى مع الفيديو الرقمي» لمواصلة اهتام مؤتمرات 
استرجاع النصوص باسترجاع الوسائط المتعددة & (Voorhees‏ 
Harman, 2002)‏ وكان الاهتام بهذا المسار واضحاًء على الرغم من وجود 
تداخل في التقنيات الخاصة باسترجاع الفيديو وتقنيات استرجاع النصوص. 
ونتيجة لذلك انفصل المسار عام 27٠٠7"‏ كجهد تقييم مستقل» يسمى تركفيد 
.TRECvid (www.nlpir.nest.gov/ projects/trecvid)‏ 

مسار العنكبوتية Web track‏ ويمثل مهام خاصة. مجموعة وثائقها مقتطفة 
من العنكبوتية العالمية .World Wide Web‏ وتنطوي المهمة الرئيسة على 
حوالي bee ٠١‏ بايت GB‏ 10 من بيانات العنكبوتية. وكان المشاركون فيه 
يحظون بالتشجيع لدراسة مجموعة متنوعة من استراتيجيات استرجاع 
العنكبوتية» على غرار ما إذا كان من الممكن استخدام الروابط لزيادة سرعة 
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الاسترجاع. وقد بدأ هذا المسار في المؤتمر الثامن» وتوقف بعد مؤتمر .٠٠٠٤‏ 
إلا أن مسار العنكبوتية أعيد ثانية في مؤتمر 9 ٠٠١‏ لاستكشاف مهام استرجاع 
ترتبط بالعنكبوتية على وجه التحديد» تشمل مهام التنوع والكفاءة» 
ومجموعات تتكون من ما يصل إلى بليون صفحة من صفحات العنكبوتية. 
وبالمقارنة بسلفه في) بين المؤتمر الثامن ومؤتمر 5 eY e‏ كان من الممكن للمسار 
الراهن أن يستخدم زواحف عنكبوتية web crawl‏ أكبر وأحدث على غرار 
مجموعة الوثائق. 3 
ويوضح وصف جميع المسارات هذاء حجم ومدى مهام الاسترجاع التي تمت 
دراستها في مؤتمرات استرجاع النصوص. وقد تجاوزت بعض المسارات فعلا 
الأهداف التي حددت ها في البداية؛ فمؤتمرات استرجاع النصوص في جوهرهاء على 
سبيل المثال» مشروع لتقييم استرجاع النصوصء إلا أن مسارًا حول استرجاع الفيديو 
Gb‏ فعلا في المؤتمر العاشر. ومثل هذه المسارات» كما ذهبت سبارك جونز Sparck‏ 
Jones (2000)‏ امتدادات لمؤتمرات استرجاع النصوص. يضاف إلى ذلك» كما ألمح 
هارمان وفورهيس (2006) «Harman and Voorhees‏ في الشكل رقم ۳/٤‏ في 
بحثهماء إلى أن معظم المسارات التي طبقت بدءا من المؤتمر الأول حتى مؤتمر 273٠١‏ 
تدخل في الفئات التالية (مع إضافة المسارات التي بدأت بعد مؤتمر ۳٠٠۲ء‏ حيثما كان 
ذلك (Use‏ 


e‏ النصوص الثابتة: المسارات» والخاص» والقوي. والتلقيم المرتد للصلاحية. 
e‏ النصرص المتدفقة: التو جيه» والتنقية. 


« البشرية: التفاعلي والاسترجاع عالي الدقة من الوثائق HARD‏ 
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۵ خارج نطاق الإنجليزية: متعدد اللغات» واسترجاع المعلومات عبر اللغات 


.CLIR 
خارج نطاق النصوص: التشويش» واسترجاع الوثائق الناطقة» والفيديو»‎ e 
ه البحث في العنكبوتية: الرصيد بالغ الضخامةء والعنكبوتية» والتيرابايت»‎ 
والكيانات.‎ 


٠‏ الإجابات وليست الوثائق: إجابة الأسئلة» والحدة. 


« المجال: دراسات الجينوم» والمشروع» والقانوني» واسترجاع المعلومات 


التقييم وأحكام الصلاحية: 


استخدم التقييم في مؤتمرات استرجاع النصوص TREC‏ مقياسي الاستدعاء 
والتحقيق التقليديين» ومن ثم فقد كانت أحكام الصلاحية ضرورة لا فكاك منها. 
وكان أولئك الذين صاغوا الأسئلة» مشاركين أيضا في التقييم أحيانا. وكانت طريقة 
التجميع البؤري pooling‏ التي تناولناها في »7/1١/7/1١/١١‏ تستخدم لتشكيل 
تجمع البيانات للتقييم» في جميع مؤتمرات استرنجاع النصوص. وكان كل فريق مشارك 
يقدم للرعاة الوثائق المئة المسترجعة المتربعة على القمة» في كل شوطء وذلك لسؤال 
بعينه؛ نظرا لتطبيق خوارزمية للترتيب الطبقى في جميع نظم الاختبار» وذلك على نتائج 
خرجات الاسترجاع» ely‏ على الصلاحية المنتظرة. 

وكان كل مشارك في التقدير يحكم في المتوسط على حوالي ٠٠٠١‏ وثيقة» لكل 
سؤال. وكان اكتمال الأحكام واطرادها في مؤتمرات استرجاع النصوص» يراجعان في 
دراسات منفصلة» وقد بدت النتائج تبدو إغجابية )2000 .(Voorhees & Harman,‏ 
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وكانت هناك حزمة تقييم معيارية» تستخدم لتسجيل نتائج كل شوط من الأشواط التي 
يتم إنجازها. وكان مقياس التقييم الأكثر كثافة في الاستعمال» في مؤتمرات استرجاع 
النصوصء هو التحقيق المتوسط الذي نوقش في .٤/۱/۲/۱/۱۱‏ كما كان يتم أيضاً 
حساب أنواع أخرى من مقاييس التقييم المعتمدة على الاستدعاء والتحقيق» في مؤتمرات 
استرجاع النصوص. وقد لخصت سبارك جونز )2000( Spiirck Jones‏ مقاييس أداء 
المسارات التي طبقت» بدءا من المؤتمر الرابع حتى المؤتمر السادس. كذلك قدم باكلي 
وفورهس )2005( Buckley and Voorhess‏ وصفا ضافيا lal‏ التقييم wel‏ 
استخدمت في مؤتمرات استرجاع النصوص . إلا أن جميع مقاييس التقييم لم تكن تقيم 
سوى أداء الاسترجاع؛ نظراً YAN‏ كانت جميعها أشكالاً ختلفة للتحقيق والاستدعاء 
تاركة الأبعاد الأخرى لنظم استرجاع المعلومات دون مساس. ومن ثم» فإن سلسلة 
مؤترات استرجاع النصوص» تعالج مقاييس التجقيق والاستدعاء المرتفعين» بوصفههم| 
هدفها النهائي» وليسا هدفا فرعيا )2008 Robertson,‏ . 


نتائج مؤتمرات استرجاع النصوص: 

لقد أسفرت مؤتمرات استرجاع النصوص عن نتائج كثيرة جداً» متنوعة بحيث 
يصعب حصرها في هذا السياق؛ ومن ثم فإننا نلخص النتائج العامة فقط 
على النحو التالي: 

o‏ هناك كثير من الطرق المختلفة تمام الاختلاف التي تؤدي على مستوى مشابه» 
الأمر الذي يدل على أن ”جميع الطرق تفضي إلى روما“ فمن الممكن للطرق 
المختلفة أن تسعى لتحقيق الهدف نفسه. 

٠‏ يعمل التجهيز الآلي (أي صياغة الاستفسارات أو ناتج الاسترجاع) 
بكفاءة التجهيز اليدوي نفسها إلا أنه قد لا يبدو مقنعاً تماماء بالنسبة 
للاستفسارات البسيطة. 


486 


تبدو أساليب التكشيف والبحث» القائمة على الإحصاء» منخفضة التكلفة 
واف oes‏ ا اوه امكو Ace NSC‏ 
ومن الممكن هذه الأساليب أن تعمل على نحو أفضل بكثير» من النطوط 
الأساس للمصطلحات البسيطة» على الرغم من أنه من الممكن هذه 
الأساليب أن تصنف ضمن نوع ما من التدريب الجماعي. 


تسهم العبارات البسيطة» إلى جانب المصطلحات المفردة» بشىء Jy LE cle‏ 
على وعد إضافي بالنسبة للطرق الآلية في المجال. i‏ 


لا يبدو توافر تلقيم الصلاحية المرتد» وكذلك التوسع المعتدل في 
الاستفسارات مفيداً. إلا أنه ليس هناك في مؤتمرات استرجاع النصوص» 
تقدم يذكر نحو هدف صياغة استفسار واحد فعال» وذلك في مقابل تصنيف 
الاستفسارات والاستراتيجيات وفقاً للمهام الخاصة. وبعبارة أخرى» فإن 
النظام لا يزال عاجزاً عن تحليل الطلب» وفقاً لمضامين صياغة مصطلحاته 
آلا واغتهار استزاتيضية Zane‏ لصياغة الاستساراته يمن أن phn‏ عن 
أفضل النتائج. 


مشكلات مؤتمرات استرجاع النصوص: 


النقد الرئيس الذي يوجه لمؤتمرات استرجاع Lele pal‏ سارت في 


الأساس على خطى تجارب كرانفيلد» باستعمال بيئة اختبار اصطناعية» وباتخاذ 
الاستدعاء والتحقيق مقياسين لأداء الاسترجاع. 


واصطناعية سلسلة مؤتمرات استرجاع النصوص ثلاثية الأبعاد؛ أولما أن 


الوثائق التجريبية التي استخدمت في المؤتمرات المبكرة» التى كانت تتكون في المقام 
الأول من الصحف» كانت تجمع خصوصاً للمشروعء ولم تكن مجموعة تكونت طبيعياً 
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عل مو السين che i a os‏ أن تكون متدرا فيا بالتسبة لأغراضن أرق 
كثيزة» فإنها لا يرجع إليها بكثافة فيا يتعلق بمعظم جهود البحث العلمي. ثانياء ‏ 
يكن لسلسلة مؤتمرات استرجاع النصوص مستفيدون حقيقيون متمرسون؛ فقد 
كانت الأسئلة أو طلبات البحث» كم في كرانفيلد» مصنعة خصوصاً من أجل 
المشروع. وكان الاسترجاع يتم بواسطة من قاموا بتطوير النظام» كما كان أداء 
الاسترجاع يحكم عليه من قبل مقيمين ربا يكونون تمن صاغوا الأسئلة أيضا. ثالثاء 
كانت التجارب تتم في بيئة مختبر تقليدي» بدرجة معينة من الانضباط والمعالجة. ولا 
يمكن ربط مثل هذه البيئة التجريبية بالنظم العاملة الحقيقية. 

وفضلاً عن ذلك» هناك مشكلات تتعلق بطريقة التقييم المتبعة في مؤتمرات 
استرجاع النصوص؛ فأوجه القصور التي تكتنف استخدام الاستدعاء والتحقيق 
كمقياسين لتقييم أداء الاسترجاع» من ناحية» ماثلة تماما في مؤتمرات استرجاع 
النصوص؛ نظراً OY‏ الاستدعاء و التحقيق هما المقياسان الرئيسان اللذان وقع عليها 
الاختيار للتقييم في المشروع. ومن ناحية أخرىء لم يتم لأغراض التقييم» تجميع سوى 
النتائج المتربعة على القمة» المسترجعة من كل نظام؛ ومن ثم» فإن تقديرات مؤتمرات 
استرجاع النصوص يمكن أن تبدو أفضل مما كان يمكن أن تكون عليه في حالة تغطية 
التقييم لكل النتائج. ووفقاً لبحث أعده زوبل )1998( Zobel‏ فإن الاستدعاء في 
مؤتمرات استرجاع OIS «yo piel‏ قدي وتطرى عل Riles‏ فيه عن للف دو 
الحاجة إلى المزيد من التقييم الإحصائي واضحة؛ نظراً OY‏ منحنيات الاستدعاء في 
مقابل التحقيق» التي قدمها كل فريق مشارك» كانت متقاربة في معظم الأحيان» 
وهناك حاجة للتحقق Le‏ إذا كانت هناك فعلاً أي فروق ذات دلالة إحصائية بين نائج 
نظامين» أو مجموعتين من نتائج النظام نفسه. كذلك يبدو من الضروري تجاوز حدود 
المتوسطات؛ لفهم أداء النظم على نحو أفضل. يضاف إلى ذلك أنه من إلصعب بمكان 
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إجراء تحليل للإخفاق على النتائج؛ نظراً لضخامة عدد الوثائق التجريبية التي شملتها 
التجاربء والحد الموضوع لمخرجات الاسترجاع )1995 (Harman,‏ وقد تمت 
الإشارة أيضاً إلى غياب تحليل الإخفاق في سلسلة مؤتمرات استرجاع النصوص» من 
جانب روبرتصون )2008( -Robertson‏ 

وتتبع مؤتمرات استرجاع النصوص Mle]‏ نبج الصندوق الأسود» بالنسبة 
للتقييم؛ إذ تتم المقارنة بين النظم ككتل لأغراض قياس الأداء» عن طريق التتائج التي 
استرجعتها فرق البحث )2000 ds -(Sparck Jones,‏ يتم التوصل إلى معلومات 
تذكر حول ما يمكن أن يكون لاستراتيجيه معينة» أو أداة من قدرة على تغيير أداء 
النظام» وذلك على الرغم من أن مؤتمرات استرجاع النصوص كانت تعقد منذ عام 
7 . وهناك حاجة واضحة إلى نهج الصندوق الزجاجي الشفاف من أجل مهمة 
التقيبم. وكررت سبارك جونز )2006( Spirck Jones‏ الإعراب عن هذه الحاجة. 
بالدعوة إلى انتباه مؤتمرات استرجاع النصوص للتعامل لأدق الدقائق المميزة» في تقييم 
استرجاع المعلومات. 
أهمية مؤتمرات استرجاع النصوص: 

بكثير من خصائصها الفريدة (كحجم الوثائق التجريبية والعدد المتزايد للفرق 
المشاركة على سبيل المثال) تشغل مؤتمرات استرجاع النصوص موقعاً مهما في تاريخ 
تقييم تنظيم المعلومات واسترجاعها. وقد اتضحت أهمية سلسلة المؤتمرات هذه في 
الجوانب التالية: 

AGI‏ أنها توفر متتدى منفتحاً ومشجعاً بالنسبة لتقييم تنظيم المعلومات 
واسترجاعها. ولأنها منتدى منفتح؛ فقد شجعت على المشاركة من جانب كثير من 
المؤسسات والمنظيات في الداخل والخارج. Les‏ منتدى مشجع؛ فقد حثت المشاركين 
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على إدخال المزيد من التحسينات على نظمهم» فقد حدث بالفعل على سبيل المثال» أن 
تمت ملاحظة تحسينات مهمة في أداء الاسترجاعء في المؤتمر الثاني عما كان عليه لجال في 
المؤتمر الأول )1995 .(Sparck Jones,‏ 

ثانا تمت J‏ الكثبر من الأساليب المختلفة في مؤتمرات استرجاع النصوص؛ با 
في ذلك استرجاع المقاطع أو الفقرات» ودمج oid!‏ والتكشيف الإحصائي 
والتكشيف الاحتمالي» واستراتيجيات وزن المصطلحات. أما تقنية الاسترجاع البولينية» 
فعلى الرغم من أهميتهاء فإنها لم تكن لها الغلبة في المشروع. وفضلاً عن ذلك؛ فإن حجم 
المجموعات التجريبية يبلغ OV‏ ما يقدر بالجيجابايت لا بالميجابايت» (S‏ كان في جهود 
التقييم المبكرة» وبذلك تصبح هذه المجموعات AST‏ اقترابا من موقف الحياة الواقعية» من 
حيث الحجم. ولقد كانت مؤتمرات استرجاع النصوص تتطور نحو ما يضاهي بيئة العمل 
الواقعية» التي تكفل نقل نتائج التجارب لتدخل في المتتجات التجارية» وذلك بعائدات لا 
يمكن إنكارها )2000 (Kowalski & Maybury,‏ ونظم استرجاع الإنترنت أمثلة 
بارزة I‏ بحوث مؤتمرات استرجاع النصوص. ولقد كانت قدرة هذه النظم على توجيه 
المستفيدين نحو ما يبحثون عنه من معلومات» أمرا جوهريا بالنسبة لنجاح العنكبوتية 
(Harman & Voorhees, 2006)‏ 

UE‏ تبدو مؤتمرات استرجاع النصوص AST‏ قابلية للتعميم» من كشير من 
المشروعات الأخرىء ويرجع ذلك جزئياء إلى أن هذه المؤتمرات جهد بحثي متواصل. 
إذ إنها تحاول الإجابة على كثير من التساؤلات» التي يمكن وضعها في مثل هذه الفئات 
العريضة؛ كنماذج التكشيف والاسترجاع» ولغات التكشيف» ووصف الوثائق» 
ومصادر التكشيف» والاستفسارات» ومصادر الاستفسارات» واستراتيجيات 
البحث؛ ومعايير احتساب النقاط» وقدرة نظم استرجاع المعلومات على التعلم 
.(Sparck Jones, 2000)‏ 
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ويمكن القول إجمالآًء إن مؤتمرات استرجاع النصوص على قدر كبير 
من الأهمية بالنسبة للمجال. كذلك تم اقتراح احتالات بحوث جديدة 
للمستقبل» تشمل: 

٠‏ عقد مؤتمرات استرجاع النصوص» على فترات متباعدة» بحيث يتاح الوقت 
هضم ما يتم الحصول عليه فعلاً من نتائج. 
تركيز الجهد على مهام أو مسارات أقلء من أجل مواصلتها بمزيد 
من التعمق. 1 
إدخال مستفيدين حقيقيين في المشروع» للارتفاع بمستوى قابلية نتائج 
البحوث للتطبيق. 
وضع تطبيق نتائج تجارب استرجاع المعلومات في الصدارة» ودفع مؤتمرات 
استرجاع النصوص على نحو أكثر حزما تجاه دراسات الاستر جاع في 
سياقات-عملية. 
اتباع نهج الصندوق الزجاجي الشفاف في التقييم» بإشراك الفرق كل على 
حدة» في الاستراتيجية أو الأداة المحددة» وربما أيضا على مستوى العامل 
coded‏ بدلا من اتباع نبج الصندوق الأسود» حيث تقارن النظم إجمالاً من 
حيث الأداء» عن طريق النتائج التي يحصل عليها كل فريق. 
الشروع في إجراء دراسات متعددة cel gli‏ بتطبيق خبرة مؤتمرات استرجاع 
النصوص في هذه الدراسات. ومن شأن الاسترجاع أن تتم دراسته بوصفه أحد 
مكونات النظام» الذي يمكن أن يكفل أيضاً التلخيص الآلي للنصوص 
daar jl‏ اس PE‏ 
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كلمة أخبرة حول تقييم تنظيم المعلومات واسترجاعها: 

ترمز تجارب كرانفيلد» وسلسلة مؤتمرات استرجاع النصوصء للمشكلات 
والقضايا التي ينطوي عليها تقييم تنظيم المعلومات واسترجاعها. ويمكن القول 
بوجه عام» أن معظم مشروعات التقييم يتم تنفيذها في المختبرات» لا في مواقف الحياة 
الحقيقية» وذلك بمجموعات اصطناعية» وطلبات مصنعة. وعادة ما يكون حجم 
de pool‏ التجريبية صغيراء وإن كانت سلسلة مؤتمرات استرجاع النصوص تعد 
استثناءً. ويستخدم الاستدعاء والتحقيق» والتسرب fallout‏ كمقاييس تقييم في 
غالب الأحيان. إلا أنه لا يمكن التعويل عليها؛ LAY‏ من بين المخاوف الأخرى» تقوم 
على أحكام ذاتية للصلاحية. وفضلاً عن ذلك» تركز معظم مشروعات التقييم على 
هذه المعايير كل على حدة (كالاستدعاء والتحقيق» على سبيل المثال) في غياب إطار 
شامل لتقييم النظام برمته. والخلاصة: أننا نعلم ما يحدث في مثل هذه النظمء إلا أنه لا 
يتضح DEY‏ ما يتعلق بأسباب حدوث ذلك» وكيف يحدث» نظراً لنهج الصندوق 
الأسود للتقييم. 

وقد طرح الكثير من الأفكار والمقترحات» لدفع البحث في تقييم تنظيم 
المعلومات واسترجاعها قدماء بالخروج عن حدود النماذج القائمة» وتطبيق التعددية 
المنهجية؛ فقد وصف هارتر وهيرت )1997( Harter and Hert‏ على سبيل المثال» 
إطاراً ناشئاً لتقييم تنظيم المعلومات واسترجاعهاء يركز على استخدام الأبعاد والطرق 
المتعددة» والتقييم من منظور عدة مشاركين في أنشطة تنظيم المعلومات واسترجاعها. 
كما أا يؤمنان بقوة» Ob‏ تفاعل المستفيد مع النظام ينبغي أن يوضع في الحسبانء أثناء 
عملية التقييم» في العصر الرقمي. ومن ناحية أخرى» فإن مشروعات التقييم المستقبلية 
ينبغي أن تتم في بيئة واقعية» وتستخدم مقاييس أخرى» خلاف الاستدعاء والتحقيق 
والتسرب» وذلك للتغلب على وجهي القصور الأسوأ تأثيرأ في جهود التقييم السابقة 
في المجال؛ وهما الذاتية في الحكم على الصلاحية» وعدم القدرة على تحديد العدد 
الإجمالي للوثائق الصالحة في النظام. 
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الفصل الثاني عشر 
الذكاء الاصطناعي ني تنظيم المعلومات واسترجاعها 


الذكاء الاصطناعى artificial intelligence (AT)‏ جال هيدف إلى جعل 
الآلات قادرة على النهوض بمهام» يمكن أن تستلزم ذكاءًا» إذا ما نض بها البشر. 
وتبدي أوساط تنظيم المعلومات واسترجاعها اهتاما واضحا بيبحوث الذكاء 
الاصطناعي, أملا في استثار تطبيقاته في تنظيم المعلومات واسترجاعها. وعلى الرغم 
من تآلف البانحثين في الذكاء الاصطناعي» مع الإثارة والإحباط أيضاء في السعي 
لتحقيق أهدافهم» Of‏ حماسهم لم يفتر» ily‏ على العكس» جرت أعداد متزايدة من 
المحاولات لتطوير تطبيقات الذكاء الاصطناعي» لأغراض تنظيم المعلومات 
واسترجاعهاء وخاصة منذ أصبحت العنكبوتية العالمية المنصة الرئيسة لتنظيم 
المعلومات واسترجاعها. ويلقي هذا الفصل نظرة شاملة على بحوث الذكاء 
الاصطناعيء في سياق تنظيم المعلومات واسترجاعها. ويحظى قطاعان نشطان 
لبحوث الذكاء الاصطناعي لأغراض تنظيم المعلومات واسترجاعها؛ وما معالجة 
اللغة الطبيعية (NLP)‏ والعنكبوتية الدلالية- بالمناقشة» بالإضافة إلى أوجه قصور 
بحوث الذكاء الاصطناعي واحتالاته بالنسبة لتنظيم المعلومات واسترجاعها. 


نظرة عامة على بحوث الذكاء الاصطناعي: 

لقد استقر الذكاء الاصطناعي كمجال للبحث» منذ عام ١167‏ على الأقل» 
عندماعقدمؤوؤّتثمر دارتٌهاوث Sparck & Jones (1991) Dartmouth‏ 
Conference‏ ودف الذكاء الاصطناعي لتطوير نظم تتصرف بذكاءء باستخدام 
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الحاسبات» لإنجاز مهام تستلزم البرهان على أساس المعرفة الواعية. ويمكن أن تفسر 
المعرفة في الذكاء الاصطناعي» بوصفها Land‏ من المعلومات والحقائق والقواعد 
المعتمدة؛ أي إن مجرد الحدس والفطرة السليمة common sense‏ لا غنى ere‏ 
بالنسبة للأنشطة الفكريةء كحل المشكلات. واتخاذ القرارات على سبيل JEL‏ والأهم 
من EUS‏ أن الذكاء الاصطناعي من المفترض أن ينطوي على مكون أو عنصر قادر 
على البرهنة أو إقامة الحجة» كا في مقدور البشرء في المواقف التي لا تتاح Led‏ سوى 
المعرفة الجزئية أو الارتباط غير المباشر؛ فنظام الذكاء الاصطناعي لأغراض تنظيم 
المعلومات» ينبغي أن يكون قادرا على ale}‏ مصطلحات أوسع أو أضيق أو متصلة» 
تبعا لمحتوى الوثائق. وبعبارة أخرى» فإن النظام ينبغي أن يكون قادرا على التحقق من 
العلاقات بين المصطلحات التي تتضمنها الوثائق Als‏ هذه العلاقات. وينبغي 
للنظام أن يتمتع بذكاء اصطناعي» يحاكي الذكاء البشري» لكي ينجز المهمة. 

ويتم الحصول على المعرفة» في الذكاء الاصطناعي. عن طريق عملية هندسة 
المعرفة» التي يحصل فيها مهندس المعرفة على بغيته من خبير المجال» وهو إنسان واسع 
المعرفة إلى أبعد حد. في حقل أو مجال بعينهء وذلك اعتتمادا على طرق ALUMS‏ 
والملاحظة» وأساليب التفكير على نحو مسموع. ثم يتم تمثيل المعرفة المكتسبة أو 
التعبير عنها اعتمادا على قواعد الإنتاج”*' production rules‏ أو الشبكات SY)‏ 
أو الأطرء على سبيل المثال لتشكيل قاعدة معرفية: وتشكل القاعدة المعرفية» إلى جانب 
التدابير الأخرى (كمحرك الاستدلال inference engine‏ وإمكانية التعلم الذاتي» 
على سبيل المثال) أحد تطبيقات الذكاء الاصطناعي. 


(*) ناتج برنامج حاسبي» يستخدم عادة لتوفير شكل ما من الذكاء الاصطناعيء يتكون في المقام 
الأول من مجموعة من القواعد حول السلوك. وهذه القواعد تمئيل أساس ثبتت جدواه في 
التخطيط الآليء والنظم الخبيرة. (المترجم) 
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وقد تمت تجربة طرق مختلفة» في بحوث الذكاء الاصطناعي. في العقود الماضية. 
وقد أشار مولنز )2005( Mullins‏ إلى الأساليب التاليةء القائمة على المعرفة» بالنسبة 
للذكاء الاصطناعيء عندما عاود النظر في موضوع الآلات القادرة على التفكير؛ وهي 
المنطق الرمزي» والشبكات العصبية الاصطاناعية؛ والاستدلال الافتراضى 
Bayesian‏ والتصوير os JL‏ المغناطيسي الوظيفي functional magnetic‏ 


.resonance imaging (fMRI) 


والمنطق الرمزي نبج رياضي» يتم فيه التعبير عن الأفكار والمفاهيم؛ برموز 
كقواعد الإنتاج أو التسلسلات ا هرمية للمفاهيم. ثم تعالج هذه الرموز فيم بعد. وفقا 
لقواعد المنطق. ونظرا لتوافر المعلومات الكافية؛ هناك أمل في أن تصبح نظم المنطق 
الرمزي هذه» ذكية في النهاية. وفي شرح أساليب التعلم الرمزي YW‏ وهي مكون 
لاغنى عنه في المنطق الرمزي» أشار تشن )1995( Chen‏ إلى أن التعلم من الأمثلةء 
وهو حالة خاصة للتعلم الاستقرائي inductive‏ يبدو أكثر أساليب تعلم الآلات 
رمزياء حملا بالوعود» بالنسبة لاكتشاف المعرفة» أو تحليل البيانات؛ فالمستفيد على 
سبيل المثال» يسترجع مجموعة مبدئية من المقالات» ويقسمها إلى صالحة وغير صا حة 
بالنسبة لاهتمامه. ثم تستخدم هذه الأمثلة الإيجابية والسلبية بعد ذلك لتدريب النظام 
على التقاط الملامح المشتركة للمقالات .(Jenning & Higuchi, 1992) iLa‏ 

وتحاكي الشبكات العصبية الاصطناعية» في المستوى البدائي» الطريقة التي 
تعمل بها الخلايا العصبية في المخ؛ فهي تتكون من خلايا عصبية اصطناعية مترابطة» 
أي البرمجة التى تحاكى خواص الخلايا العصبية البيولوجية. وتحاكى الخوارزميات 
الوراثية genetic algorithms‏ وهي أحد أشكال تطور الشبكات Sl all TE‏ 
الجينى والقدرة على استنباط حلؤل أفضل لمشكلة مافي كل جيل» بينا HS‏ 
sh‏ زات الارتباطية القادزة fo‏ اكتساب all‏ من جاتب AS pn]‏ 
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الخلايا العصبية المترابطة (نقاط الارتكاز (nodes‏ ونقاط SLL SY!‏ أو الارتباط 
العصبى synapses‏ الموزونة (الروابط (links‏ والوحدات المنطقية المبدئية. ومن 
ا د خوارزميات التعلم» لضبط أوزان الارتباط» بحيث يكون النظام 
قادرا على التنبؤ بالأمثلة غير المعروفة» أو تصنيفها على النحو الصحيح (Chen,‏ 
(1995. واعتادا على تصنيف المفاهيم القائم على الشبكات العصبية» على سبيل المثال» 
tel‏ تشن وآخرون )1994( Chen, et al.‏ قائمة مبدئية بالأفكار والموضوعات 
المهمة» التي يتم التعبير عنها في تعليقات اللقاءات أو المؤتمرات. 

وقد أدت النظم التي تستخدم الأسلوب الرياضي المعروف باسم الاستدلال 
الافتراضي» إلى ارتفاع مستوى أداء كثير من برامج الذكاء الاصطناعي» إلى حد يكفل 
إمكانية الاعتماد عليها في العام الواقعي. ومساعد مشبك ورق ميكروسوفت أوفيس 
(Microsoft Office paper clip assistant‏ أحد التطبيقات المعتمدة على نظم 
الاستدلال الافتراضي» على الرغم من أنه لم يلق استقبالا حسنا. ومن ناحية أخرى 
تبنى لاو وكويرا )2006( 001658 Lau and‏ الأنموذج الافتراضي» للتنبؤ بتأثير 
البحث في العنكبوتية العالمية» على اتخاذ مجموعة من الأطباء للقرارات. 

والتصوير بالرنين المغناطيسي الوظيفي (101181) أسلوب يستخدم لمعرفة أي 
أجزاء المخ ينشط عندما يكون الشخص بصدد التفكير في شيء LF‏ بعينه؛ فعندما 
يطلب من الأشخاص تخيل أداة (مطرقة على سبيل المثال) أو مبنى (منزل على سبيل 
المثال) فإن مناطق المخ نفسها هي التي تنشط على النحو الذي يمكن أن يحدث عند 
مشاهدة صورة لهذه الأشياء. ومن المفترض أن يكون بإمكان باحثي الذكاء 
الاصطناعيء تدريب برنامج للنظر في صور المخ» وأن يقرر بنسبة دقة 4١‏ بالمئة» ما إذا 
كان ذلك الشخص يفكر في أداة أو مبنى )2005 (Mullins,‏ ويمكن لمشل هذا 
البرنامج أن يقرأ في النهاية مخ الشخصء وبذلك يجعل بالإمكان التحقق من 
احتياجات البشر من المعلومات» على نحو أفضل وأكثر وضوحا أو صراحة. 
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وما لاشك ad‏ أن هذه الطرق الأربع للبحث في الذكاء الاصطناعيء لا 
تشكل جميع الخيارات المتاحة. وما النهج اللغوي الذي يطبق على نطاق واسع» في 
معالجة اللغة الطبيعية» في الذكاء الاصطناعي» إلا أحد أمثلة هذه الخيارات. وبين| 
يتجاوز حدود مجال هذا الكتاب» تقديم دراسة تحليلية كاملة لطرق الذكاء 
الاصطناعيء فإنه يبدو أن باحثي الذكاء الاصطناعي» pe‏ النظر عن الأساليب 
المحددة التي يمكن لهم دراستهاء يتطلعون جميعا لتطوير تطبيقات لمجالات كثيرة 
(كالشخوص الآلية robotics‏ والتحقسق من BIYI‏ على سبيل (JUN‏ وتنظيم 
المعلومات واسترجاعها أحد هذه المجالات. وقد بذلت جهود في مجال تنظيم 
المعلومات واسترجاعهاء لتطبيق الذكاء الاصدطناعي في اقتطاف أو اقتباس 
extraction‏ المعلومات» والتلخيص الآلي» والرد على الاستفسارات» والبحث في 
اللغة الطبيعية» والوكلاء الأذكياء intelligent agents‏ فضلاً عن أمور أخرى. 
وتبدو معالجة اللغة الطبيعية والعنكبوتية الدلالية»همايجالا البحث في 
الذكاء الاصطناعي اللذان يمكن أن يسه على أحسن وجه» في مجال تنظيم 
المعلومات واسترجاعها. 


معالجة اللغة الطبيعية: 

معالحة اللغة الطبيعية مجال للبحث والتطبيق» يستكشف كيف يمكن لنصوص 
اللغة الطبيعية» التي يتم إدخاها للحاسبء أن تعالج وتحول إلى شكل أكثر ملاءمة 
للمزيد من المعاللجة )1999 .(Chowdhury,‏ وکا ذهب ليدي )1998( Liddy‏ فإن 
معالحة اللغة الطبيعية» مجموعة من الأساليب الحاسبية الخاصة بتحليل وتمثيل 
النصوصء التي ترد على نحو ظبيعي» في مستوى واحد أو أكثر للتحصيل اللغوي؛ 
وذلك لأغراض تحقيق معالجحة للغة أشبه LULL‏ البشرية» من أجل إنجاز مجموعة من 
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المهام أو التطبيقات المحددة. وتشمل هذه المهام أو التطبيقات في le‏ التلخيص 
SY!‏ والرد على الاستفسارات )2000 (Carbonell et al.,‏ ونناقش هنا كلا 
من التطبيقين على حدة» بعد بيان دور معا لجة اللغة الطبيعية في تنظيم 
المعلومات واسترجاعها. 
دور معالجة اللغة الطبيعية في تنظيم المعلومات واسترجاعها: 

اللغة المنطوقة أو المكتوبة» مكون أساس في كل من تنظيم المعلومات 
واسترجاعها؛ نظرا لأن المعلومات ينبغي التعبير عنهاء عندما يتم تجهيزها ونقلها أو 
إيصاها. واللغة الطبيعية» في تنظيم المعلومات واسترجاعهاء في مقابل أي لغة 
اصطناعية أخرى» هي اللغة التي يمكن للبشر استعالها للتعبير عن المعلومات أو 
تمثيلهاء أو صياغة الاستفسارات. ومن الممكن معالجة اللغة الطبيعية في الذكاء 
الاصطناعيء في المستويات الصوتية» والصرفية» والمعجمية, والنظمية syntactic‏ 
والدلالية» والحديث أو الخطاب discourse‏ والوظيفية أو النفعية (Doszkocs,‏ 
Liddy, 1998)‏ ;1986ء ولكل هذه المستويات مضامينها بالنسبة لتنظيم 
المعلومات واسترجاعها. 

وينطوي المستوى الصوتي للتحليل على معالجة أصوات الكلام. ويمكن لهذا 
الضرب من المعالجة أن تكون له أهميته في استرجاع الأصوات (راجع 9/ ۲/ ۲)» 
الذي يشتمل» على سبيل SL‏ على المدخلات الصوتية أو المعلومات المنطوقة. 
وخاصية at”‏ الصوت e sound like‏ في استرجاع المعلومات (كالعثور على سبيل 
المثال» على الوثائق التي تشتمل على مصطلحات لها جر Yi fee gh” ibe:‏ 
يمكن تنفيذها إلا على المستوى الصوت ALLL‏ اللغة الطبيعية NLP‏ 
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ويتعلق المستوى الصرفي للمعالجة بالعناصر التي تستعمل لتكوين الكلمات 
المفردة» كجذوع الكلمات أو جذورهاء والسوابق» potty‏ واللواحق» ANS y‏ 
المركبة؛ فكلمة cuniterm‏ على سبيل المثال» تتكون من السابقة uni‏ وجذر الكلمة 
.term‏ والبتر أسلوب للاسترجاع مشتق من هذا المستوى ALL‏ ومن الممكن 
لتنظيم المعلومات» كالتكشيف DY)‏ على سبيل المثال» أن يتم أيضاء وبدرجة معينة» 
عند معالجة الوثائق على المستوى الصرفي. 

وعادة ما تدل Lull‏ على المستوى العجمي lexical‏ على مغزى IS‏ 
واستعالحاء كتحديد ما إذا كانت كلمة book‏ على سبيل SL‏ قد قصد Le‏ كم في 
العمل المنشور أم كما في إجراء حجز. وتشمل المضامين بالنسبة لتنظيم المعلومات 
واسترجاعهاء في هذا المستوى للتحليل اللغوي: )١(‏ إزالة أو إزاحة كلمة الاستبعاد 
(Y) estop-word‏ استبدال مصطلح البحث SY‏ وإضافته (كالبحث في المكنز على 
سبيل (SLAM‏ (۳) اكتشاف الأخطاء الهجائية وتصحيحهاء )£( معالجة الأسماء 
الاستهلالية والمختصرات عن طريق عمليات البحث في قوائم المفردات. 

ويعرب المستوى النظّمي للتحليل الجمل؛ لتوضيح ما بين كلمات الجمل من 
علاقات نحوية؛ ما إذا كانت الوحدة البنيوية جملة أم عبارة أم فقرة» على سبيل المشال. 
وتنطوي هذه العملية أيضا على الحاجة إلى (النحوء الذي يصف الترتيب المحتمل 
للكلمات ومختلف قواعد التوافق؛ فمن الممكن للعبارات الإسمية على سبيل المغال» 
التي يتم التحقق منها في التحليل على المستوى النظّميء أن تكون مرشحة 
كمصطلحات للتكشيف. والبحث بالعبارات» والبحث بالتجاور» كل هذه تطبيقات 
للغة التي تعالج على المستوى النظمي. 

وتحاول LLU‏ على المستوى SY!‏ إضفاء معنى على مختلف المكونات 
النظمية للجملة. ومن الممكن أن تدعو الحاجة إلى ختلف المساعدات الدلالية 
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(كالمكانز على سبيل المثال) لإجراء التحليل اللغوي في هذا المستوى. وتتكون عينة 
للتطبيقيات في هذا الصدد بالنسبة لتنظيم المعلومات واسترجاعهاء من العرض JII‏ 
للإحالات» والمترادفات» والمصطلحات المتصلة. إلا أنه لا يمكن للمعالجة على 
المستوى الدلالي» أن تتم بنجاح دون التحليل اللغوي على المستوى الوظيفي. 

ويفسر مستوى الطاب itl discourse‏ اللغة (الذي لم يذكرفي 
(Doszkocs, 1986‏ المبنى والمعنى اللذين تحملهما النصوص الأكبر من الجملة. 
Ses as ella‏ لتر مده Shen] fo a OF LLL‏ الى عل 
نحو يتجاور أو يخرج عن نطاق ما يمكن إيصاله بالكللات أو الجمل المفردة. ويمكن 
للغة الطبيعية» التي تعالج على مستوى الخطابء أن تستعمل لفهم الدور المحدد لكل 
عنصر من عناصر المعلومات في الوثيقة؛ ما إذا كان» على سبيل ILM‏ خلاصة:؛ أو 
وجهة نظرء أو تنبؤ أو حقيقة ببساطة. ومن الواضح أن هذا البنيان مضامينه المحددة 
بالنسبة لاسترجاع المقاطع أو الفقرات passage‏ نظرا لأن المقطع في هذا السياقء 
يمكن أن يكون أطول من الجملة. 

ويحاول المستوى الوظيفي 2241م أعلى مستويات معالجة Lal‏ تحديد 
معنى اللغة على ضوء السياق المحيط؛ والمؤلف. والمستفيد. والإحاطة بالعالم الواقعي. 
ويمثل هذا المستوى من LLM‏ أكبر تحر لباحثي الذكاء الاصطناعيء في معالجة اللغة 
الطبيعية. فالبشر يعتمدون فعلا de‏ السياق والمعارف الأخرى لفهم اللغة والتخلص 
من الغموض. إلا أن ما تنطوي عليه هذه العملية من تعقد وصعوبة» لم يتم استيعابه 
كاملا بعد ولم تتطور النظم القادرة على حاكاة كيفية معالجة البشر للغة في هذا 
المستوى. ويمكن لتطبيق هذه العملية في تنظيم المعلومات واسترجاعهاء أن يكون أمرا 
غير عادي» وعلى قدر هائل من الأهمية؛ إذا ما أمكن تحقيق اختراق في معالحة اللغة 
الطبيعية» في هذا المستوى. ويمكن لكثير من التطبيقات التي كانت تراود الأحلام في 
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تنظيم المعلومات واسترجاعهاء كالتلخيص الآلي» والاستفسار باللغة الطبيعية» أن 
تصبح حينئذ حقيقة واقعة. كذلك يمكن لتبديل اللغات «vocabulary switching‏ 
الذي عرضنا له بإيجاز في نهاية الفصل الرابع» كوسيلة للانتقال تلقائياء من إحدى 
لغات تنظيم المعلومات واسترجاعها إلى أخرى» عبر DYLE‏ موضوعية مختلفة» أن 
يفيد أيضا من اتجاه البحث هذا في الذكاء الاصطناعي. 

وإذا ما أمكن إنجاز معالجة اللغة بنجاح على المستوى الدلالي والوظيفي 
والخطاب. فإنه يمكن للعنكبوتية الدلالية التي تصورها تيم بيرنرز-لي Tim‏ 
Berners-Lee‏ ورقاقه؛ أن تصبح حقيقة واقعة. ونستكشف موضوع العنكبوتية 
الدلالية في القسم .۳/٠١‏ ومن ناحية أخرى» تحدد المستويات السبعة المختلفة التي 
تنطوي عليها معالجة اللغة الطبيعية» معام ما يمكن لمعالجة اللغة الطبيعية أن تحققه 
بالنسبة لتنظيم المعلومات واسترجاعها. وكل| ازدادت وحدة التحليل حجا (أي من 
المورفيم morpheme‏ أي أصغر وحدة صرفية» إلى الكلمة» ثم الجملة» ثم الفقرة» 
إلى الوثيقة الكاملة) تتراجع دقة الظواهر اللغوية» ويزداد الخيار الحر والقابلية للتغير. 
وبينما يمكن إنجاز المستويات الأربعة الأولى للمعالجة» على نحو معقول في أيامنا coda‏ 
فإن الحاجة تدعو لإجراء المزيد من البحوث في إتمام التحليل اللغوي على المستوى 
الدلالي» ومستوى الخطاب» وخصوصا المستوى الوظيفي. ويمكن لجهود البحث في 
علم اللغة الحاسبي» واللغويات بوجه عام» وفلسفة اللغة» وعلم اللغة الاجتماعي» أن 
تيسر بحوث الذكاء الاصطناعيء في معالجة اللغة الطبيعية & (Cercone‏ 
-McCalla, 1984)‏ 


ونظرا لأهمية اللغة في تنظيم المعلومات واسترجاعها؛ فإن مضامين معالجة 
اللغة الطبيعية بالنسبة لتنظيم المعلومات واسترجاعهاء تبدو واسعة المدى. ويشكل 
التلخيص الآلي» والرد على الاستفسارات (QA)‏ المجالين التطبيقيين الرئيسين في هذه 
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ky (Carbonell, et al., 2000) i231‏ يمكن النظر إلى التطبيقات الأخرى 
(كاقتطاف المعلومات أو اقتباسهاء والبحث في اللغة الطبيعية» على سبيل المخال)» 
بوصفها امتدادا لما ينطوي عليه التطبيقان الرئيسان أو اشتقاقاً منهما. ونناقش في أقسام 
لاحقة» التلخيص الآلي والرد على الاستفسارات» ونتبعهه بتطبيقات الذكاء 
الاصطناعي الأخرى في مجال تنظيم المعلومات واسترجاعها. 
التلخيص الالي: 

التلخيص الآلي هو إعداد طبعة موجزة من نص ماء بأحد برامج الحاسب. 
وترجع جهود البحث في هذا الصدد» إلى خمسينيات القرن العشرين» [a>‏ كان هانز 
بيتر لون Hans Peter Luhn‏ يجري تجاربه على إعداد المستخلصات آليا (1958). 
ولما كانت المعلومات في العصر الرقمي» تنمو بمعدلات أسية» frais‏ إلى Some‏ 
Peta ky‏ (أي ٠١‏ ") في وقت قصير جدا )2008 (Campbell,‏ استخدمت طرق 
مختلفة» كالتلخيص الآلي على سبيل SLAM‏ للتعامل مع سيول البيانات الجارفة. 
والتلخيص الآلي» الذي يبدو في سبيله في الواقع OY‏ يصبح قطاعا في حد ذاته» في Jle‏ 
تنظيم المعلومات واسترجاعهاء نظام ييدف على وجه التحديد لإتتاج ملخصات» 
باستعال تقنيات معالحة اللغة الطبيعية. 

وللتلخيص في هذا السياق معنيان؛ أولهم| الاقتطاف أو الاقتباس cextraction‏ 
وثانیه) الاستخلاص abstraction‏ وإن کان ينبغي الإشارة إلى أن هذا الأخير ليس 
هو نفسه المستخلص التقليدي» الذي عالحناه في ¥/ (Sa. V/V/V‏ ذهب ماني Mani.‏ 
)2001( فإن الاقتباس ملخص يتكون برمته» من مواد مستنسخة من المصدر الذي 
يتم إدخاله» [eg‏ المستخلص ملخص يشتمل على الأقل» على بعض العناصر التي لم 
يكن لها وجود في الأصل الذي تم إدخاله. وتشمل المحددات الأخرى للتلخيص 
الآلي معدل الضغط أو التركيز sl) compression‏ نسبة طول الملخص إلى طول 


512 


المصدر الأصلي)» والمتلقي (أي ما ]15 كان Lele‏ أم مركزا في Calakan‏ وحجم المصدر 
(أي ما إذا كان وثيقة واحدة أم عدة وثائق)ء والجنس الأدبي Le Vis) genre‏ أو 
رسائل البريد الإلكتروني» أو رسائل المدونات» أو صفحات العنكبوتية)» واللغة (أي 
ما إذا كان أحادي اللغة» أم متعدد اللغات» pf‏ عبر اللغات) والوسائط (كالنصوص» 
والأصوات» والصورء والفيديو). وعادة ما تصنف الملخصات وفقا هذه المحددات؛ 
فالملخصات التي تنشأ للجمهور العام؛ على سبيل المثال» تسمى الملخصات العامة. 


عملية التلخيص الالي: 

كا يمكن أن يتبين LI‏ من قائمة المحددات التي سبق ذكرهاء فإن بعض أنواع 
الملخصات الآلية (كتلك الخاصة بالوثائق المفردة على سبيل المثال) أيسر في الحصول 
عليهاء من الأنواع الأخرى (كتلك الخاصة بالوثائق المتعددة على سبيل المثال). 
وتنطوي عملية التلخيص الآلي» بوجه عام على الخطوات الرئيسة التالية: التحقق من 
الجملة واختيارهاء واقتطاف الجملة» وعمليات صقل smoothing‏ الملخص. وفي 
الوقت الذي لا يمكن فيه الاستغتاء عن الخطوتين الأوليين بالنسبة لأي تلخيص آليء 
فإن عمليات صقل الملخص,قد لا يتم إنجازها؛ نظرا OY‏ معظم حالات التلخيص 
الآلي تتم بمجرد ترتيب الجحمل» بدلا من صقل الملخص في هذه الخطوة. ولاتتم 
عمليات الصقل الحقيقية للملخص» أي جعل الملخص أكثر قابلية للقراءة» لا تتم إلا 
عندما يكون الناتج النهائي مستخلصا )2001 (Mani,‏ وبإمكان النظم الراهنة 
للتلخيص JYI‏ بو جه cele‏ إعداد مقتطفات أو اقتباسات لا مستخلصات (Over,‏ 
Dang & Harman, 2007; Sparck Jones, 2007)‏ ومن بين الخطوات الثلاث 
التي تم التحقق منها في عملية التلخيص الآلي» يعد التحقق من الجملة واختيارها 
الهم والأصعب» في حين يتم اقتطاف الجملة آليا في المقام الأول» ولا يتم صقل 
الملخص إلا بالنسبة للمستخلصات فقط؛ ومن ثم فإن أنموذج تجهيز الملخص 
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التخطيطى schematic‏ 2, الذي عرضته سبارك جونز Sparck Jones‏ 
)2007( في الشكل رقم )١(‏ في تقريرهاء يبدو أكشر ملاءمة بالنسبة لإنتاج 
المستخلصات. والأمر كذلك أيضا بالنسبة للهندسة المعمارية architecture‏ 
للملخص رفيع المستوى» الذي صوره ماني )2001( Mani‏ 


المقاربات الرئيسة للتلخيص الالي: 

كما هو الحال بالنسبة لأنشطة تنظيم cole gall‏ واسترجاعها الأخترىة ها 
مقاربات أو مناهج مختلفة للتلخيص SM‏ وقد قسمت سبارك جونز ‘Sparck‏ 
Jones (2007)‏ هذه المقاربات إلى اقتباسية extractive‏ في مقابل غير الاقتباسية» 
وذلك بناء على ما إذا كان الناتج النهائي اقتباسا. ثم تحققت بعد ذلك من ثلاث فئات 
فرعية للمقاربات الاقتباسية؛ هي الإحصائية الأساسية» والإحصائية المدعمة 
0 معو تعلم الآلات .machine learning‏ وتدل الطرق الإحصائية 
الأساسية للتلخيص الآلي» على استعمال تردد المصطلحات tf‏ والتردد العكسي 
للوثائق idf‏ و(راجع 0/ ۱/ ۲/ ۲)» أو خوارزميات الوزن الأخرئ. للترتيب الطبقي 
للجمل المصدرية. ويتم اختيار الجمل من القائمة الطبقية لأعلى الأرصدة top‏ 
escores‏ حتى الوصول إلى الحد الفاصل threshold‏ لطول الملخص (كأن يكون ٠١‏ 
بالمئة من طول المصدر على سبيل المثال). وعادة ما يتم إيصال الجمل التي يقع عليها 
الاختيار» بالترتيب نفسه. الذي وردت به في المصدر الأصلي. وتشمل أوجه قصور 
مثل هذه الملخصات» ترتيب الجمل كما هي في المصدرء وتحديد وضعها الطبقي بناء 
على خوارزميات قائمة على التردد فقط. . 

والمقاربات الإحصائية المدعمة» مصممة إلى حد ماء للتغلب على أوجه قصور 
الطرق الإحصائية الأساسية. ويتم تدعيم هذه الأنواع من الاستراتيجيات» عن طريق 
الوحدات والخواص المعجمية» أو من خلال بنيان المصدر. وفي الطريقة الأولى 
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للتدعيم؛ يتم إجراء معالجة معقدة للعناصر المعجمية» التي يتم حساب إحصاءاتها. 
وتشمل هذه المعالجة كلا من أنواع الوحدات التي يقع عليها الاختيار (كالكلمات 
المتصاحبة cco-words‏ أو مجموعات الكلمات) والوزن التفاضلي لأنواع الوحدات. 
كذلك يتم أيضا التحقق من العناصر المعجمية المحددة ذات الخصائص التي تدل على 
الأهمية (كالخلاصات على سبيل (SLA‏ والكيانات الفريدة لمصادر العنكبوتية 
(كالروابط والمحددات الموحدة لأماكن المصادر URLs‏ على سبيل (SLA‏ في عملية 
التلخيص. Gy‏ مقابل ذلك تعتمد الطريقة الأخرى للتدعيم» على الاستخدام المكئتف 
لبنيان المصدرء وذلك بالخروج عن حدود الجمل» ومراعاة معلومات من قبيل بنية 
الخطاب على سبيل المثال. 

ويمثل تعلم الآلات الفئة الفرعية ASW‏ للمقاربات الاقتباسية للتلخيص 
الآلي» فمن المفترض في التلخيص» إذا ما تم على النحو الصحيح» أن يكون تعبيرا عا 
يحدد مواصفات المصدر. ومن ثم فإنه من الطبيعي التحقق مما إذا كان التلخيص عن 
طريق تعلم الآلات» يمكن أن ينتقي الملامح المناسبة للمصدرء با في ذلك أوزان 
الملامح» ومجموعات الملامح» من بين مجموعة الخيارات المحتملة. ويمكن لتعلم 
الآلات» وهو أسلوب غالبا ما يطبق في بحوث الذكاء الاصطناعي - يمكن أن ينقسم 
إلى التعلم المراقب supervised‏ والتعلم غير المراقب. ويكون التعلم مراقبا إذا ما 
كان الأمر يتطلب تدخلا ما (كتوفير أمثلة التدريب) من جانب المستفيد» من أجل 
عملية التعلم )2006 OLS, (Turmo, Ageno & Gatala,‏ الباحثون في)| مضى 
يستخدمون تعلم الآلات» في التلخيص الاقتباسي لتؤجيه الاقتباس» والتحقق من 
علاقات الخطاب» وترتيب الجمل المقتبسة» وغير ذلك )2007 (Sparck Jones,‏ 


وعلى عكس الطرق الاقتباسية التي سبقت مناقشتهاء فإن الطرق غير 
الاقتباسية قد تطورت لإعداد مستخلصات في التلخيص الآلي. وينبغي أن تكون مثل 
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هذه المستخلصاتء التي يفترض أن تمثل النص المصدري» با لا يتجاوز حدود 
العناصر المعجمية المفردة» تعبيراً أفضل عن المصدر. إلا أنه لم يكن هناك سوى قدر 
ضئيل نسبيا من التلخيص غير الاقتباسي في العقد الماضي )2007 «(Sparck Jones,‏ 
الأمر الذي يدل بدوره» إلى حد ماء على ندرة الأساليب المجدية الناجحة» لإنتاج 
ملخصات غير اقتباسية. وفضلا عن ذلك» عادة ما ينطوي ما يتم إنتاجه في هذه الفئة 
من الملخصات» على درجة ما من إعادة صياغة للمحتوى المصدري )2001 (Mani,‏ 
وليس تمثيلا موجزا لهذا المحتوى. i‏ 

ومن منظور ALLL‏ اللغوية» قسم ماني )2001( Mani‏ مقاربات التلخيص 
على نحو يختلف ke‏ ذهبت إليه سبارك جونز )2007( Splirek Jones‏ على الرغم 
من أن هناك أيضا ثلاثة أنواع من الطرق أو المقاربات؛ وهي المقاربات السطحية 
cshallow‏ والمقاربات المتعمقة» والمقاربات الهجين. ولا تحاول المقاربات الضحلة أو 
السطحية للتلخيصء الخروج عن حدود المستوى النظّمي LLL‏ اللغة الطبيعية» بين 
تتكفل المقاربات المتعمقة» بوجه عام بالمستوى الدلالي للجملة على الأقل» والمقاربات 
المتعمقة للتلخيص الآلي أكثر صعوبة من المقاربات السطحية في التطبيق» نظرا للوضع 
الراهن للمعرفة في تقنيات معالجة اللغة الطبيعية. وتسمى المقاربة الثالشة للتلخيص» 
التي حددها ماني )2001( Mani‏ بالطريقة الهجين» وتنطوي على قدر كبير من إعادة 
ترتيب النص» على نحو يشمل تغيير العلاقات المعتمدة على الخطاب» كجزء من 
عمليات صقل الملخص. وكا سبق أن بينا فإن عمليات صقل الملخصء لا تتم بانتظام 
أثناء التلخيص» ويرجع ذلك إلى حد ماء إلى أن التقنيات الخاصة بمثل هذه العمليات 
لاتزال في مرحلة التطوير. 
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تقييم التلخيص الآلي: 

لمم كان التقييم أمراً لا غنى عنه للارتفاع بمستوى جهود تنظيم المعلومات 
واسترجاعهاء فإن مؤتمرفهم الوثائق Document Understanding‏ 
(DUC;duc.nist.gov) Conference‏ وهو برنامج» يشبه سلسلة مؤتمرات 
استرجاع النصوص TREC series‏ من أوجه كثيرة» nb‏ عدا تركيز موقر فهم 
الوثائق» الذي يعقد منذ عام Ye e ١‏ على تلخيص النصوص. وقد نظر أوفر ودانج 
وهارمان )2007( Over, Dang & Harman‏ بعمق في عمليات التقييم» التي Gs‏ 
في مؤتمر فهم الوثائق» من عام ۱ حتى عام DUC 2001-2006 ٠٠١‏ إلى 
جانب الأنشطة الماثلة» التي تتم في مؤتمر تقييم التلخيص Summarization‏ 
JOly Evaluation Conference (SUMMAC)‏ سى آي NTCIR Í‏ (إن آي 
آي مجموعة الاختبار لنظم استرجاع المعلومات NII Test Collection for TR‏ 
(Systems‏ وقد استخدم نوعان رئيسان من التقييم في هذين المؤتمرين» من أجل 
اختبار المللخصات؛ وهما التقييم الجوهري أو المتعمق cimtrinsic‏ والتقييم السطحي 
„extrinsic‏ ويركز التقييم الجوهري على وجه التحديدء على قياس جودة المللخصات 
الناشئة مباشرةء بين يركز التقييم السطحي على قياس مدى نجاح الملخصات في دعم 
الأداء في مهام معينة. وموضوع مؤتمر فهم الوثائق DUC‏ هو تلخيص النصوص الذي 
يشمل التلخيص الآلي» ولكنه يشمل أيضا الطرق اليدوية في العمل. وبالإضافة إلى 
الكشف عن أن الملخصات الآلية الناشئة في مؤتمر فهم BLS‏ من عام ٠٠١١‏ إلى 
۰۰٦‏ مقتطفات في المقام cg VI‏ سجل أوفر ودانج وهارمان & Over, Dang‏ 
«Harman (2007)‏ النتائج التالية: 


© معظم الملخصات اليدوية أفضل ولاشك من معظم الملخصات ASV‏ 


٠‏ لا تختلف معظم الملخصات الآلية اختلافا جوهريا عن بعضها البعض. 
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dale ٠‏ ما تختلف الملخصات الآلية في حدودها القصوى. اختلافا جوهريا فيا 
ه .نادرا ما يكون أداء الملخصات الآلية أفضل من الحدود الدنيا (أي التقاط 
الجمل أو الفقرات الافتتاحية) اعتمادا على بنية المقالات الإخبارية. 

وفضلا عن ذلك» اقترح أوفر ودائج وهارمان Over, Dang & Harman‏ 
)2007( ضرورة انتقال مؤتمرات فهم الوثاتق DUC‏ المستقبلية» لا إلى ما يتجاوز المواد 
الإخبارية فحسبء وإنما إلى مهام التلخيص الجديدة» التي توحي بها أوجه الإفادة 
الحقيقية من الملخصات (كالملخصات في مجالات بعينها كالطب والقانون على 
سبيل SEL‏ 


Text Analysis Conference _,o,2—Ji تحليل‎ £5 + 55 bisity 
عن مؤتمر فهم الوثائق»‎ ٠۲٠٠۸ الذي بدأ عام‎ (TAC,www.nist. gov/tac) 
‘TREC بمؤتمرات استرجاع النصروص‎ (QA) ومسار الرد على الاستفسارات‎ 
مؤتمر تحليل النصوص إلى مساندة الببحث» في نطاق أوساط معالجة اللغة‎ Gey 
الطبيعية» وذلك بتوفير البنية الأساس اللازمة للتقييم واسع المدى» للمناهج الخاصة‎ 
(NIST بمعالجة اللغة الطبيعية. وبرعاية المعهد الوطني للمواصفات المعيارية والتقنية‎ 
وغيره من الأجهزة الحكومية الأمريكيةء يحل مؤتمر تحليل النصوص محل مؤقر فهم‎ 
الوثائق ق في الأساسء بينم ينهض بأدوار أخرى (كتقييم الرد على الاستفسارات على‎ 
معالحة اللغة الطبيعية.‎ SLE سبيل المثال) في‎ 
أن يكون أي شيء إلا أن يكون موضوعا بسيطاء نظرا‎ SY! ويمكن للتلخيص‎ 
Mani ماني‎ Uts وتسهم المتغيرات التي‎ -(Carbonell et al., 2000) لتعدد أبعاده‎ 
الأدبي»‎ tls (كمعدل الضغط أو التركيزء والمتلقي» وحجم المصدرء‎ )2001( 
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ونوع الملخص) جيعها في هذا التعدد في الأبعاد» الذي يدل في النهاية على ما يكتنف 
التلخيص الآلي من صعوبة وتعقد. ومن ناحية أخرى فإن البحث في التلخيص يتسع 
مداه» |S‏ يحرز التقدم )2006 MeDonald & Chen,‏ على سبيل (JL‏ ويمكن 
للإنجازات المستقبلية في التلخيص الآلي» أن تيسر إلى حد بعيدء الكثير من أنشطة 
تنظيم المعلومات واسترجاعها. 
o JT‏ على الاستفسارات: 

يمكن لكل من يجري عملية بحث» اعتمادا على نظام للاسترجاع OLS)‏ يكون 
نظاما على الخط المباشرء أو فهرسا متاحا على الخط المباشر» أو البحث بأحد محركبات 
البحث في العنكبوتية) أن يتلقى بعض النتائج في المقابل. ويمكن fol‏ هذه النتائج أن 
تشتمل على الإجابة التي يلتمسها المرء أو لا تشتمل» وعلى المستفيد أن يتصفح النتائج. 
وبعبارة أخرىء فإن نظام استرجاع المعلومات» لا يمكنه سوى الحصول على بعض 
النتائج» وعرضها للمستفيد [ay‏ يتعين على المستفيد أن يمعن النظر في النتائج» للعثور 
على الإجابة إذا كانت هناك فعلا. ومهمة المستفيد في العثور على الإجابة من التتائج 
المسترجعة» ليست هينة» لأسباب متعددة (كالوقت» والحكم على الصلاحيةء 
والمصادر التي لا يمكن الوصول إليهاء والمجموعات). ومن ثم فقد اقترحت تقنية 
الرد على الاستفسارات» لإعفاء المستفيد من عبء غربلة الإجابة من نتائج عملية 
البحث. التي غالبا ما تعد بالملايين في العصر الرقمي. 

ويعني الرد على الاستفسارات» بإيجاز أن نظام استرجاع المعلومات قادر على 
تقديم الإجابة للمستفيد على وجه التحديد» وذلك في نتائج عملية البحث» بدون أي 
معلومات غير صالحة» تختلط مبذه الإجابة. وقد قدم مايبري )2004( Maybury‏ 
تعرايفا أكثر شمولا للرد على الاستفسارات QA‏ 
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الرد على الاستفسارات (QA)‏ عملية تفاعلية بين الإنسان 
والحاسب» تشمل إدراك جاجة المستفيد إلى المعلومات» التى Bole‏ 
ما يتم الإعراب عنها باستفسار باللغة الطبيعية» ثم استرجاع 
الوثائق أو البيانات» أو المعرفة» من مصادر منتقاةء واقتطاف 
وتبيئة وترتيب أولويات الإجابات المتوافرة من هذه المصادر» ثم 
عرض الاستجابات» وشرحها بطريقة فعالة. )3 (P.‏ 
عملية الرد على الاستفسارات: 
في الوقت. الذي يبدو فيه مفهوم الرد على الاستفسارات جاذبا إلى Lal‏ حد» 
فإن تحقيق هذا اهدق ينظوي على تحديات في جميع خطوات العملية. وعادة ما يتناول 
)3 اجع على سبيل المثال Kwok, Etzioni & Weld, 2001; Lin & Katz,‏ 
2006( وعادة ما يشتمل أسلوب الرد على الاستفسارات» بوجه عام» على إعراب 
الاستفسارات أو تحليلهاء وتصنيف السؤال» وصياغة الاستفسار, واقتطاف ileyi‏ 
واختيار الإجابة» وعرضها. 
a bd,‏ الأولى في عملية الرد على الاستفسارات هي إعراب الاستفسارء أو 
تحليل الاستفسار لفهم السؤال الذي يثيره. وإذا ما كان نظام استرجاع المعلومات 
يدعم البحث في اللغة الطبيعية (راجع CE /7 /١7‏ فإن هذه الخطوة عادة ما تعالج 
بواسطة تقنية مدمجة built-in‏ وما لم يكن الأمر كذلك» فإن الاستفسار الذي يتم 
إدخاله في صندوق البحث الخاص بنظام استرجاع'المعلومات» ينبغي أن يتم تحليله 
قبل أن يكون بالإمكان انتقاله إلى الخطوة التالية في الرد على الاستفسارات. 
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ويمكن للخطوة التالية أن تكون تصنيف السؤال وفقا لإطار ما. وقد بنيت أطر 
ا کو yo‏ و ASL yy figs NS carne By‏ 
Carbonell, et al. )2000(‏ كل هذه القضايا في أربعة مستويات (أي السائل 
العارض casual‏ والسائل القولت أو النمطي «template‏ والمرسل المبتدئ cub‏ 
creporter‏ وتلل المعلومات المحترف)» وذلك في الوقت الذي درس فيه بومرانتس 
Pomerantz (2005)‏ خمسة تقسيمات رئيسة للأسئلة (أي أطر لتصنيف الأسئلة) في 
الرد على الاستفسارات: 

.١‏ أحرف دبليو 798 الستة Six Ws‏ (أي من who‏ وماذا What‏ ومتى 
when‏ وأين where‏ وكيف Chow‏ وينتمي كثير من أسئلة هذا الإطار 
للفئة الحقائقية factual‏ أو cfactoid‏ ويبدو تصنيفها على العموم مباشرا. 
وتشمل أمثلة أسئلة هذا النوع» متى ولد جورج واشنطن؟ وما أعلى مبنى في 
العالل؟ 

-Y‏ موضوعات الأسئلة: تصنف الأسئلة في هذا الإطار باستعمال لغات مقننة 
معينة (مثل تصنيف مكتبة الكونجرس» ومكنز الفنون والعمارة). ويمكن 
تصنيف هذه الأسئلة وفقا لمحتواها ا موضوعي. ويمكن لعينة من هذه 
الأسئلة أن تكون: ما أكثر طرق التدريس فعالية في التعليم الجامعي؟ 2 << 

۳. أوجه الإفادة من الإجابات المتوقعة: وتصنف الأسئلة في هذا الإطارء بالنظر 
في وظائف الإجابات المتوقعة أو أوجه الإفادة منها. فهل يمكن» على سبيل 
المثال» لإجابة للسؤال أن تستعمل لأغراض المقارنة أو التفسير؟ وقد وضع 
بومرانتس )1 Pomerantz (2005, Table‏ تقسي] لأوجه الإفادة من 
الإجابات المتوقعة. 
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.٤‏ أشكال الإجابات المتوقعة: ويبدو هذا النهج في التصنيف مماثلا للطريقة 
gl‏ عادة ما تصنف ما الأسئلة المرجعية التقليدية (كالإرشادية 
directional‏ والمرجعية الجاهزة على سبيل المثال). كذلك جمع بومرانتس 
Pomerantz (2005, Table 2)‏ الأشكال أو الصيغ المألوفة للإجابات 
المتوقعة. 

.٥‏ أنواع المصادر: تصنف الأسئلة في هذا الإطار وفقا لأنواع types‏ (أو 
أجناس) المصأدر التي يمكن أن يتم منها استقاء الإجابات. إلا أن هذا 
التصنيف لم يطبق لتصنيف الأسئلة في عملية الرد على الاستفسارات 
(Pomerantz, 2005)‏ وتشمل عينة المصادر كلا من المستخلصات» 
والكشافات» والمعاجم» والموسوعات» والكتب السنوية أو الحوليات. 


وعلى غرار النوع الثالث للتصنيف» لخص بومرانتس )2005( Pomerantz‏ 
خطة تصنف فيها الأسئلة؛ بناء على الطريقة التي يمكن بها للسائل (أي المستفيد) أن 
يفيد من الإجابة التي يسترجعها نظام الرد على الاستفسارات. وقدم كاربونل ورفاقه 
Carbonell, et al. (2000)‏ هذه الخطة. وعادة ما يوجه السائل العارض أسئلة 
بسيطة وحقائقية. إلا أن السائل النمطي أو المقولب عادة ما يطرح أسئلة يمكن 
معالجتها بقوالب معيارية» يمكن فيها العثور على أنواع معينة من المعلومات. وتشمل 
أمثلة هذه الأسئلة: ماذا نعرف عن شر كة SABC‏ وما قصة حياة الممثل س؟ ويمكن 
لإجابات الأسئلة النمطية هذه أن تكون أصعب بالنسبة لنظام الرد على الاستفسارات 
في العثور عليهاء عا هو عليه الخال بالنسبة للسائل العارض؛ نظرا لأنه غالبا ما يتطلب 
الأمر استرجاعها من مصادر متعددة. وتسمى الفئة LSU‏ ممن يوجهون الأسئلة 
بالمراسل المبتدئ eub reporter‏ وقد اختير الاسم ببساطة بوصفه ضربا من التناظر 
¢(Carbonell, et al., 2000)‏ فالمراسل toll‏ يركز على العثور على البيانات 


522 


الحقاكقية» إلا أنه بحاجة أيضا OY‏ يجمع معلومات من مصادر متنوعة. وفضلا عن 
ذلك» فإنه ليس هناك قالب معياري متاح في هذه الحالة؛ نظرا لأن بعض المعلومات 
التي Cory‏ عنها المستفيد» يمكن أن تكون جوهرية بالنسبة [Ey cae lb‏ تكون البقية 
هامشية في أحسن الأحوال. dey‏ نظام الرد على الاستفسارات أن يحدد ما ينبغي 
استرجاعه. اعتمادا على الأساليب المناسبة. وتسمى الفئة الأخيرة في هذه الخطة. 
لتصنيف مقدمى الأسثلة بمحلل المعلومات المحترف» ؤتمثل أنواعا مختلفة من 
المستفيدين» على الطرف الأعلى لطيف الرد على الاستفسارات؛ gd‏ و لاء المستفيدون» 
كفئة بحاجة إلى إجابات لأسئلة متطورة» على الرغم من wel‏ يعملون في مهن ختلفة 
(ككبار مراسلي الأخبار» والعلماء العاملين على حل المشكلات المتقدمة» والضباط 
الذين يحللون الاستخبارات على الصعيد الوطني). وغالبا ما يكون الأمر مهمة شاقةء 
بالنسبة لتطوير نظم الرد على الاستفسارات هذه الفئة من المستفيدين. 

وأيا كان الإطار المستخدم لتصييف الأسعلة ofp‏ هذا الإجراء ينبغي اتخاذه قبل 
الخطوة التالية في الرد على الاستفسارات» وهي صياغة الاستفسار؛ وذلك لضان 
تنفيذ ol glad‏ التالية بناء على ذلك؛ فمن الممكن» على E‏ المخال» للعمليات 
الخاصة بالحصول على إجابة لسؤال حقائة ئقي» أن تختلف عن تلك الخاصة بالإجابة عن 
T‏ لقح لامو شوم متو LEE accel candy,‏ السو از 
الاستفسار الذي يقدم من جانب المستفيد» يتم تحويله فعلا باستعال قواعد النظم 
syntax‏ والتفصيلاات الأخرى التي يدعمها نظام الرد على الاستفسارات» حتى 
يمكن معالحته بواسطة محرك بحث النظام على النحو المناسب الصحيح. كذلك يمكن 
تطبيق إجراءات كتحويل الفعل» وتلقيم الصلاحية المرتد» وصياغة العبارة الاسمية» 
GUS,‏ عند إعادة صياغة الاستفسار لأغراض الرد على الاستفسارات =i‏ على 
سبيل .(Kwok, Etzioni & Weld, 2001 Juli‏ 
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والخطوة الرابعة في الرد على الاستفسارات هي استخلاص الإجابة» التي 
تستقطب بالفعل معلومات معينة من المصادر» وفقا لبعض القواعد. ووراء هذه 
الخطوة اقتطاف المعلومات (LE)‏ ويمكن للمصادر المستخدمة في عملية اقتطاف 
المعلومات أن تكون مجموعات يتم بناؤها خصيصا (راجع على سبيل Lin & JUN‏ 
(Katz, 6‏ أو مجرد ما هو متوافر على العنكبوتية (راجع على سبيل JL‏ 
(Neumann & Xu, 2004‏ وتعرف القواعد التي يتم الاسترشاد بها في الاقتطاف 
بالأغلفة wrappers‏ التي تصمم sole‏ لمصدر معلومات بعينه & (Gregg‏ 
Walczak, 2006)‏ ويتم إنشاء الأغلفة» عن طريق الجمع بين تقنيات معالجة اللغة * 
الطبيعية» وتعلم الآلات» والنمذجة الإحصائية» والإلمام بالمجال (راجع على سبيل 
.(Flesca, et al., 2004 JL!‏ وبمساعدة مثل هذه الأغلفة› يتم التحقق من 
المحتويات الرئيسة في المصدر (كأسماء الأعلام» والتواريخ» والأماكن) من أجل 
الاقتطاف )2003 (EI Hadi,‏ إلا أن وجه الصعوبة الرئيس» في اقتطاف المعلومات 
LE‏ يكمن في توقفه أو اعتماده الجوهري على المجال الموضوعي؛ نظرا لأن المعرفة 
اللغوية تختلف من مجال لآخر اختلافا بينا. وقد تمت تجربة الضبط اليدوي manual‏ 
tuning‏ للمعرفة اللغوية التي تتوقف على المجال الموضوعي» كمعاجم المصطلحات» 
والدلالة المعجمية المتصلة بالمجال الموضوعي على وجه التحديد, وأنماط الاقتطاف 
(Turmo, Ageno & Gatala, 2006)‏ غير أن إجراء اقتطاف المعلومات عبر 
المجالات الموضوعية» لا يزال يشكل تحديا جوهريا. 

ومن الممكن إجراء اقتطاف المعلومات على مستويات متعددة من التجانس 
(Godly & Reighart, 2001) granularity‏ فقد حاول كل من موجسيلوفك» 
وجومیز» وروجوفيتس )2004( Mojsillovic, Gomes and Rogowitz‏ اقتطاف 
الإشارات الدلالية» كالجلد skin‏ والسماء sky‏ والحشائش snow w141;.grass‏ 
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والأشياء الاصطناعية من ole get‏ الصور. وفضلا عن ذلك. فإنه يمكن للاقتطاف 
لأغراض الرد على الاستفسارات» أن يتم أيضا بمرونة من حيث الطول؛ إذ يمكن 
لبعض المحتويات التي يتم اقتطافهاء أن تكون في حدود كلمة واحدة أو رقم» بين| 
يمكن لأخرى أن تكون عدة مئات من الكلمات طولا. 

واقتطاف المعلومات مكون مهم في استرجاع الفقرات» الأمر الذي يعني أنه 
ينبغي لاسترجاع الفقرات أن ينطوي على وسيلة للاقتطاف. ومن الممكن النظر إلى 
استرجاع الفقرات» على نحو cle‏ بوصفه حلقة في مسيرة تطور نظم الرد على 
الاستفسارات. ووجه الارتباط بين الرد على الاستفسارات واسترجاع الفقرات» هو 
أن الأول يقدم للمستفيد إجابات محددة كنتائج» [en‏ يوحي الآخر فقط Ob‏ المعلومات 
متضمنة في الفقرة المسترجعة )2005 (Coter,‏ وطول النتائج في استرجاع الفقرات» 
أقل على نحو لا يستهان به» بالمقارنة -بالطبع - بنتائج استرجاع الوثائق. 

والخطوة الأخيرة في الرد على الاستفسارات هي اختيار الإجابة بعد اقتطاف 
المحتوى الأساس الوارد في المصدر. fey‏ هذه الخطوة الحكم على الصلاحية في 
العملية العادية لاسترجاع المعلومات» اللهم إلا أن البشرء لا النظام» هم من يصدرون 
الأحكام في أنشطة البحث في غياب تقنية الرد على الاستفسارات. وما لاشك فيه أنه 
من الصعب إلى حد بعيد» أن يكون هناك نظام للرد على الاستفسارات» بإمكانه الحكم 
على الصلاحية؟ نظراً لأن الصلاحية کا بينا في ١/7/١ /1١١‏ مفهوم معقدء إلى حد أن 
البشر أنفسهم يقفون عاجزين عن التعامل معه على نحو مرض. إلا أن نظام الرد على 
الاستفسارات لا خيار أمامه له سوى اختيار الإجابات من المحتويات المقتطفة في حد 
ذاتها. وقد اقترح لن وكاتس (2006) Lin and Katz‏ ما يلي» لاختيار الإجابة: 
فالمحتويات المقتطفة ينبغي أولا أن يتم الحكم عليها؛ ما إذا كانت داعمة pl‏ غير داعمة 
أي غير able‏ قبل اتخاذ قرار الاختيار؛ فالمحتويات الداعمة لا تشتمل على خيط 
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الإجابة فحسب» Ely‏ ينبغي أن يتم التحقق من الإجابة بثقة» عندما يتم ذلك بواسطة 
الإنسان» بوصفها صحيحة من المصدر. أما المحتويات غير الداعمة فتشتمل على خيط 
الإجابة الذي يرد في السياق الصحيح. إلا أا لا تجيب عن السؤال فعلا. أما المحتوى 
غير الصالح فإنه إما أن يغفل خيط الإجابة كلية وإما يذكره عرضا أو من قبيل 
المصادفة. وتحدث هذه الحالة الأخيرة عند البحث بالكلمات المفتاحية» في معظم» إن م 
يكن في جميع الأحيان. ومن بين الففات الثلاث لنتائج الحكم» يمكن اختيار 
المحتويات الداعمة فقط بوصفها إجابات» وتقديمها للمستفيد» على الرغم من أنه 
ينبغي أن نلاحظ أن المحكمين البشر هم من يقومون بتحديد المحتويات الداعمة. إلا 
أن صلاحية الإجابة أمر آخر» يوضع في الحسبان في اختيار الإجابة (Link & Katz,‏ 
(2006. فإلى أي حد على سبيل ILM‏ ينبغي أن يكون التاريخ المقصود على هذا 
النحو؟ فهل العام وحده كافء أم أنه ينبغي أيضا ذكر الشهر واليوم؟ 

وبإنجاز خطوة اختيار الإجابة» تصل عملية الرد على الاستفسارات برمتها إلى 
غايتهاء وذلك على الرغم من أن تقديم الإجابة» أحيانا ما Gh‏ بوصفه خطوة إضافية, 
أو الخطوة الأخيرة )2004 (Maybury,‏ وكما كان الباحثون يفعلون في-التلخيص 
الآلي» فإنه يتم اختيار مجموعة متنوعة من الطرق (الإحصائية» واللغوية» والقائمة على 
المعرفة» والتفاعلية على سبيل المثال) في تطوير نظم الرد على الاستفسارات. وتشكل 
هذه الطرق سلسلة طويلة» وغالبا ما تستخدم بتجميعات مختلفة. وقد وفر مسار الرد 
على الاستفسارات» الذي استمر من مؤتمر استرجاع النصوص الثامن TREC-8‏ 
حتى مؤتمر ۲٠٠۷‏ وهو على هذا النحوء واحد من أطول المهام الخاصة وفر منصة 
قيمة لباحثي الرد على الاستفسارات» للتواصل lab‏ بينهم. يضاف إلى ذلك أن هذا 
المسار قد عزز حدوث طفرة في بحوث الرد على الاستفسارات» أسفرت بدورها عن 
تقنيات جديدة للرد على الاستفسارات )2005 .(Voorhess,‏ ومن الممكن وللاشك؛ 
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لتأسيس موقر تحليل النصوص TAC‏ الذي أشرنا إليه بإيجاز في ۱۲/ ۲/ ٠۳/۲‏ أن 
يوفر المزيد من الدوافع للبحث في الرد على الاستفسارات. 
تطبيقات الرد على الاستفسارات: 

هناك OV‏ نوعان من تطبيقات الرد على الاستفسارات؛ ينطوي أحدهما على 
التدخل البشري في عملية الرد على الاستفسارات» ولا ينطوي الآخر على مثل هذا 
التدخل. وتعتمد عمليات استرجاع المعلومات في الحالة الأولى» في الأساسء على 
قاعدة بيانات للأسئلة» إلى جانب قاعدة بيانات للإجابات في المقابل. ويقوم نظام 
استرجاع المعلومات أولا ببناء قاعدة بيانات الأسئلة» التي يتم تجميعها من مصادر 
مختلفة (كالاستفسارات التي تشتمل عليها سجلات عمليات البحث search logs‏ 
على سبيل المثال). ثم يتم وضع إجابات لكل سؤال في قاعدة البيانات» اعتادا على 
المصادر المتاحة للمستفيدين المستهدفين (كمواقع العنكبوتية على سبيل (JLN‏ ويتم 
اختزانها في قاعدة بيانات الإجابات. وعندما يتم إدخال طلب في صندوق البحث» 
يراجع نظام ple feel‏ المعلومات قاعدة بيانات الأسئلة الخاصة به لمعرفة ما إذا كانت 
هناك مضاهاة لهذا الطلب أم لا. وإذا ما تم العثور على مضاهاة بين طلب البحث 
وقاعدة بيانات الأسئلة» يسترجع النظام إجابة من قاعدة بيانات الإجابات» باتباع 
الرابطة الواصلة بين قاعدتي البيانات. وما لم يكن الأمر كذلك» فإنه لايتم تقديم 
نتيجة للبحث. وقد استخدمت الطبعة المبدئية لنظام آسك دوت كوم Ask.com‏ 
(الذي كان يعرف من قبل باسم آسك جيفز (Ask Jeeves‏ وهو نظام لاسترجاع 
معلومات الإنترنت» هذه الطريقة الخاصة بقاعدتي بيانات الأسئلة والإجابات» الأمر 
الذي يوضح لاذا يقدم هذا النظام إجابات كاملة لبعض الأسئلة» ولا إجابات (eB‏ عدا 
التشويش في معظم الأحيان. 
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أما الفئة الأخرى من نظم الرد على الاستفسارات (أي تلك التي تعتمد على 
تقنيات الذكاء الاصطناعي كاملةء وباتخاذ الخطوات التي سبقت مناقشتها) فلا وجود 
ها ؛ نظرا لأن مثل هذه النظم لا تزال دون الوضع الراهن للمعرفة في المجال 
(Voorhess, 2005)‏ ومن ثم» فإن الباحثين في هذا Led‏ يتبعون Lowe‏ للتفرقة 
divide-and-conquer is 5415‏ مع الرد على الاستفسارات. بالتعامل مع المهام 
التي يمكن التعامل معها بشكل أيسر من غيرها (كالرد على الاستفسارات ABUL‏ 
واقتطاف المعلومات من مصادر العنكبوتية) قبل غيرها. ومن ناحية أخرى» تم وضع 
خريطة طريق» للتخطيط على نحو نسقي وعلى وجه التحديد. لبحوث المستقبل في 
الرد على الاستفسارات )2002 (Maybury,‏ 

ومن الملائم في النهاية» النظر في العلاقة التكاملية المفيدة على وجه الخصوص» 
القائمة بين التلخيص الآلي ونظم الرد على الاستفسارات؛ نظرا لأن تطور التطبيقات 
الأخرى (كالبحث في اللغة الطبيعية على سبيل المثال) يتوقف على Legals‏ ومن منظور 
التلخيص. فإن الرد على الاستفسارات أحد طرق كفالة التركيز للتلخيص الموجه نحو 
الاستفسارات» ومن منظور الرد على الاستفسارات فإن التلخيص أحد طرق اقتطاف 
المعلومات الصالحة فقط ونشرهاء من كل النصوص» إجابة لسؤال غير حقائقي بعينه 
(Carbonell et al., 2000)‏ وفضلا عن ذلك» فإن التلخيص الآلي والرد على 
الاستفسارات يواجهان» من تحديات جوهرية ممائلة» في مساراتهها نحو النضج» 
كتطبيقين رئيسين للذكاء الاصطناعي في تنظيم المعلومات واسترجاعها. 
البحث باللغة الطبيعية: 

يعني البحث باللغة الطبيعية (أو الاستفسار (Lys‏ أن بإمكان المستفيد إدخال 


عمليات بحث محددة (كالعبارة أو السؤال على سبيل المثال) دون المرور بعملية صياغة 
الاستفسار أو التعبير عنه. وتدل صياغة الاستفسار أو التعبير ace‏ الذي نوقش في 
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٥‏ على عملية ترجمة طلبات الببحث» إلى استفسارات يمكن لنظام استرجاع 
المعلومات معالجتها. فلماذا السماء زرقاء؟ على سبيل SL‏ سؤال بحث باللغة 
الطبيعية» لا يمكن لنظام استرجاع المعلومات التقليدي معالجته على النحو الملائم. إلا 
أن نظام استرجاع المعلومات نفسه ينبغي أن يكون قادرا على التعامل مع استفسار 
بحث من قبيل «sky AND blue‏ دون أي مشكلات. 
التي تدعم البحث باللغة الطبيعية» وتلك التي لا تدعم ذلك؛ ففي الحالة الأولى يقوم 
نظام استرجاع المعلومات بإنجاز مهمة صياغة الاستفسار للمستفيد» بين من المتوقع 
في الحالة الأخرى. أن يقوم المستفيد بإنجاز عملية صياغة الاستفسار» حتى يكون 
بإمكان نظام استرجاع المعلومات معالجته. وبعبارة أخرى. فإنه بالنسبة للسؤال BU?‏ 
السماء زرقاء؟“ Why is the sky blue?‏ كمثال» يمكن لنظم استرجاع المعلومات» 
القادرة على معاللجة استفسارات اللغة الطبيعية» أن تكون قادرة على الأقل» على تنفيذ 
مايل: 
° تدل كلمة why BU‏ على أن ما يتم البحث عنه يتعلق بالسبب» أو العلة» أو 
إجابات LE‏ أخرى للسؤال. 
ees °‏ را عي sai‏ 
E rere ee ere °‏ 
بالمعامل البولينى AND‏ ليشكلا استفسارا لهذا السؤال. 
٠‏ ويتم تجاهل علامة الاستفهام في معالحة الاستفسار باللغة الطبيعية؛ نظرا OY‏ 
علامات الترقيم لا تشكل عادة جزءا من الاستفسارء مالم يتم النص على 
عكس ذلك على وجه الخصوص. 
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وربما تبدو هذه الخطوات سهلة بالنسبة للبشرء إلا أنها تفرض تحديات ضخمة 
بالنسبة لنظام استرجاع المعلومات. وتلك التخديات هي في الأساس مايجاول 
الباحثون في معالحة اللغة الطبيعية التصدي ها. وعلى الرغم من أن البحث باللغة 
الطبيعية يبدو بالفعل شديد الجاذبية» Of‏ تطبيقه يعتمد بكثافة على البحث والتطوير» 
في التلخيص الآلي والرد على الاستفسارات» اللذين نوقشا في ۲/۲/۱۲ NAVAS‏ 

ويتم اتباع النهجين الرئيسين لتطوير نظم الرد على الاستفسارات (راجع 
)١ 5‏ في إجراء البحث باللغة الطبيعية أيضا. وطريقة قاعدتي بيانات الأسئلة 
والإجابات» التي تناولناها آنفا يكتنفها القصورء إذ أن تقنيتها الأساس يدوية فعلا. 
وفضلا عن ذلك فإن الطلب لا يمكن بحثه أو النظر cad‏ إلا إذا كان متضمنا فعلا في 
قاعدة بيانات الأسئلة الخاصة بنظام استرجاع المعلومات. غير أنه لا يمكن لأي قاعدة 
بيانات» مهما بلغت ضخامتهاء أن تشتمل على جميع الأسئلة التي يمكن للمستفيدين 
توجيههاء ومن ثم فإن نظام استرجاع المعلومات يصبح لا جدوى منه» عندما HŽ‏ 
قاعدة البيانات من سؤال معين» حتى وإن كان النظام يدعم ما يسمى بالبحث باللغة 
الطبيعية. ويظل النهج الآخر للبحث GUL‏ الطبيعية» lS‏ أوضحنا في ۱۲/ ۲/ ۳/ ۲» 
رؤية أكثر منه حقيقة؛ نظراً OV‏ تقنيات معالجة اللغة الطبيعية» بالنسبة لإنشاء نظم 
عاملة للرد على الاستفسارات» لا تزال في مرحلة التطوير» ومن ثم فإن قليلا فقط من 
نظم استرجاع المعلومات» التي تدعم البحث باللغة الطبيعية» قد أصبحت حقيقة 
واقعة حتى الآن. 

وأحيانا ما يسمى البحث باللغة الطبيعية بواجهة اللغة الطبيعية؛ نظرا لأن 
الواجهة هي ما يتفاعل معها المتعامل مع نظام استرجاع المعلومات» أثناء عملية 
البحث. وفضلا عن ذلك فإن الخطوتين الأوليين في عملية الرد على الاستفسارات 
(وهما إعراب الاستفسار أو تحليله وتصنيف السؤال) ترسيان في جوهرهماء الأساس 
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بالنسبة للبحث UL‏ الطبيعية؛ lib y‏ فإن البحث باللغة الطبيعية» شأنه شأن 
استرجاع الفقرات» مرتبط بتطور تقنية الرد على الاستفسارات. وأخيرا ينبغي أن نبين 
أن البحث باللغة الطبيعية» ليس بحثا بدون أي استخدام للغات المقيدة (كالمكانز على 
سبيل المثال). ويسمى البحث في الحالة الأخيرة ببحث الكلات المفتاحية. 


العنكبوتية الدلالية: 


العنكبوتية الدلالية semantice web‏ هي أكثر المشروعات التي نفذها اتحاد 
العنكبوتية العالمية W3 (World Wide Web Consortium)‏ وكثير من الباحثين» 
طموحا حتى الآن؛ فقد كانت جزءا من رؤية تيم بيرنرز-لي «Tim Berners-Lee‏ 
منذ أعد الطبعة الأولى من العنكبوتية» في مطلع العقد الأخير من القرن العشرين» على 
الرغم من أن بيانا ووصفا للعنكبوتية الدلالية المتصورة» لم يصدر إلا بعد حوالي عقد 
من الزمن في )2001( Berners-Lee, Hendler and Lassila‏ ويعرّف المؤلفون 
في هذا البحث قوي التأثير» العنكبوتية الدلالية بوصفها امتدادا للعنكبوتية الراهنة» 
يتم فيه إضفاء معنى واضح على المعلومات؛ على نحو يمن البشر والحاسبات من 
العمل معا بشكل أفضل. وفي سياق تبرير إدخال جال موضوعي جديد» وهو علم 
العنكبوتية» في التعليم العالي» واصل بيرنرز-لي» وهول» وهندلر Berners-Lee,‏ 
Hall and Hendler (2006)‏ القول على وجه التحديد» بأنه في عنكبوتية الوثائق 
sola‏ ا اج قاف عفن 
الدلالة أو gall‏ من صفحات نصوص هذه الوثائق. ويمكن لعنكبوتية من البيانات 
العلائقية» والتأكيدات المنطقيةء والطرق الإيعازية cheuristic‏ أن تلخص معا المعاني 
أو الدلالات المقصودة التي تستعمل في التواصل البشري. وفضلا عن ذلك» فإن 
العنكبوتية الدلالية» بمجرد تنفيذهاء يمكن أن تكفل لنظم البيانات التي وضعت 
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بمعزل بعضها عن بعضء الارتباط معاء دون الحاجة إلى اتفاق عام حول المصطلحات 
والمفاهيم. 

ونظرا OY‏ العنكبوتية الدلالية لا تزال مجرد رؤية» على الرغم من التوصيفات 
الخيالية المثيرة» التي ترد في نصوص Ge‏ فإن المزيد من المعالجة النظرية لا يمكن أن 
يكفل أي تأكيد أو إثبات أو برهان» [ily‏ يكفل المزيد من التخمين بشأنها. ومن ناحية 
أخرى» أجريت البحوث النشطة في مجالات عدة» كا هندسة المعمارية للعنكبوتية» 
لتيسير تطور العنكبوتية الدلالية. ` 


الهندسة المعمارية للعنكبوتية الدلالية: 


حتى قبل انتشار عبارة العنكبوتية ASY‏ وصح بيرنرز-لي Berners-Lee‏ 
(2000) معالم الهندسة المعمارية لهذه العنكبوتية» في رسم بياني من سبع طبقات (الشكل 
رقم .)١/17‏ وقد قدمت منذ ذلك الحين» تفسيرات لهذا الرسم البياني» من جانب 
عدة مؤلفين» في سياقات ختلفة» ومن زوايا مختلفة (راجع على سبيل SLE‏ 
.(Greenberg, 2003; Legg, 2007‏ ولا تبدو هناك ضرورة لتكر ار شرح كل من 
الطبقات السبع» في هذه ال هندسة المعمازية. وعوضا عن ذلك» سوف نلقي أولا نظرة 
فاحصة دقيقة على هذه الطبقات» من القاعدة إلى القمة؛ فالطبقة الثانية (لغة الترميز 
القابلة للامتداد +XML‏ فضاء الاسم ANS‏ خطة لغة الترميز القابلة للامتداد 
23 والطبقة الثالئة (إطار وصف +RDF pladi‏ خطة إطار وصف 
المصادر (rdfschema‏ و الطبقة الرابعة (لغة التصنيف «(ontology vocabulary‏ 
والطبقات مرتبة في الرسم البياني» تبعا لأهميتها المباشرة بالنسبة لتنظيم المعلومات 
واسترجاعها. أما الطبقات الأربع الأخرى؛ أي الأولى (الترميز الموحد unicode‏ 
والمحدد الموحد للمصدر (URI‏ والخامسة (المنطق)» والسادسة (البرهان) والسابعة 
(الثقة)» فلا تحظى بالمناقشة في هذا الكتاب؛ نظرا لأن الترميز الموحد والمعرف الموحد 


532 


للمصدر يمثلان مرحلة ما قبل العنكبوتية الدلالية» بين) للطبقات الثلاث الأخيرة 
علاقة غير مباشرة بتنظيم المعلومات واسترجاعهاء في هذا السياق» على الرغم من أنها 
تنهض بأدوار حاسمة في تكوين العنكبوتية الدلالية. 

وكا يتضح من الشكل رقم »١ VY‏ فإن الدلالة التي يتم تجميعها وتنظيمها 
ونشرها عن طريق العنكبوتية الدلالية» يتم اشتقاقهاء وكذلك تحديدها أو تعريفها 
بالطبقات الثلاث الخاصة ببندستها المعمارية» التي نحاول استكشافها في هذا السياق. 
وتتكون الطبقة الثانية من ثلاثة عناصرء هي لغة الترميز القابلة للامتداد» التي تكفل 
القدرة على إنشاء ما وراء البيانات le dy Stall olan Lot‏ فرج شن دود 
مستوى النظم» بينا يسر كل من فضاء الاسم Namerpace (NS)‏ وخطة لغة 
الترميز القابلة للامتداد ol) xmichema‏ إطار ترميز لغة الترميز القابلة للامتداد) 
استخدام قابلية ما وراء البيانات للتشغيل التبادلي» في لغة الترميز القابلة للامتداد 
XML‏ وعلى عكس لغة ترميز النصوص الفائقة Hyper Text Markup‏ 
«Language (HTML)‏ التي : تصوغ format‏ ما هو موجود على العنكبوتية فقط 
(كالبنط والحجم على سبيل المثال) يمكن للغة الترميز القابلة للامتداد أن تصوغ 
ob glee‏ العنكبوتية» بنفس طريقة تكشيف قاعدة البيانات بالحقل (كالمؤلف 
والعنوان على سبيل المثال). فهب أن لدينا المؤلف John Doe‏ الذي نشر المقالة 8. 
وباستخدام لغة ترميز النصوص الفائقة» OP‏ كل ما نستطيع عمله هو صياغة John‏ 
Article Bs Doe‏ بخيارات الصياغة المتاحة» كا لحروف italics IU‏ وبنط التايمز 
الروماني الجديد «Times New Roman‏ وحجم الخط ۲ على سبيل المثال. 


غير أنه في حالة لغة الترميز القابلة للامتداد XML‏ يمكن ترميز المعلومات 
نفسها على <publication> ,<author> John Doe </author>: S+‏ 
article B </publication>‏ على التوالي. ونظرا لأن ترميز لغة الترميز القابلة 
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للامتداد» يعمل بطريقة مماثلة إلى حد بعيد للتكشيف بالحقل» أحد خطوات إنشاء 
قواعد البيانات التقليدية؛ فإنه ينبغي توفير تقنية ما للتحكم لضان قابلية الترميزات 
الناشئة» بمختلف النظم» في OVE‏ مختلفة» للتبادل أو التشغيل التبادلي ked‏ بعد؛ 
ف <publication>...</publication>‏ على سبيل المثال» هو ترميز لغة الترميز 
القابلة للامتداد بالنسبة لجميع أنواع النصوصء ولا ينبغي استعمال شكل آخر 
Document... Document‏ على سبيل المثال. وفضاء الاسم NS‏ وخطة لغة 
الترميز القابلة للامتداد xmischema‏ تقنيتان للتحكم» Jal‏ هذه الأغراض. ويمشل 
فضاء الاسم 8× أحد المجالات (كالتجارة الإلكترونية المحلية على سبيل COLL‏ 
وتوفر خطة dad‏ الترميز القابلة للامتداد» قواعد وتوجيهات لتكوين ترميزات هذه 
اللغة بالنسبة للمجال المستهدف. 

ويستخدم إطار وصف المصادر RDF)‏ راجع أيضا /7/١/7”‏ ¥( وخطة 
إطار وصف المصادر erdfschema‏ بوصفه) الطبقة الثالثة في ال هندسة المعمارية 
للعنكبوتية الدلاليةء للتعبير عن العلاقات في بين ما وراء البيانات (أي ترميزات لغة 
الترميز القابلة للامتداد) التي تعد لمعلومات العنكبوتية» في الأشكال الماثلة لإطار 
وصف المصادر (الشكل رقم (V/V‏ وفي حالة ”المؤلف John Doe‏ الذي نشر 
المقالة “B‏ على سبيل المثال» OB‏ العلاقة في هذه العبارة (أي John Doe‏ هو ”مؤلف 
المقالة “B‏ موضحة في الركن الأسفل الأيمن في الشكل رقم ؟١١/‏ 7. ووظيفة خطة 
إطار وصف المصادرءكوظيفة خطة لغة الترميز القابلة للامتداد» هي ضان أن تكون 
جميع الأشكال البيانية لإطار وصف المصادر قد نشأت باتباع خطة ممائلة» بحيث 


=? 


تكون هذه الرسوم البيانية قابلة للتشغيل التبادلي بوجه عام» في العنكبوتية الدلالية. 
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ل للامتداد + فضاء الإسم + خطة لغة الترميز 


Unicode الترميز الموحد‎ (URI) jalat aa gall a yrall 





الشكل رقم ١/٠١‏ الهندسة المعمارية للعنكبوتية الدلالية 
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وكا بينا في /٤‏ 5/ » فإن التصنيف التخصصي عنصر جوهري في العنكبوتية 
الدلالية؛ نظرا OY‏ نجاح العنكبوتية الدلالية العالمية يتوقف في النهاية على هذا 
العنصرء لتحقيق التعامل في| بين مصادر العنكبوتية» التي يتم ترميزها بلغة الترميز 
القابلة للامتدادء والتعبين عنها بالرسوم ER‏ لإطار وصف المصادرء في جميع أنحاء 
العالم» إلى جانب القواعد المنطقية التي تقابلها بالنسبة للبرهان. ويمكن النظر إلي 
التصنيف التخصصي» على نحو cle‏ بوصفه لغة مقيدة عامة (كخطط التصنيف أو 
المكانز على سبيل المثال) بالنسبة لتنظيم مصادر العنكبوتية. ووجه الاختلاف الرئيس 
بين التصنيف التخصصي ontology‏ واللغة المقيدة التقليدية» هو أن الأول قد قصد به 
التعامل مع العنكبوتية برمتهاء بوسائل آلية» بين| الآخر يدوي بوجه عام» ولا يطبق 
مطلقا على نطاق يغطي جميع المجالات في العالم. وبعبارة أخرى» فإن لغة التصنيف 
التخصصيء الطبقة الرابعة في الهندسة المعمارية للعنكبوتية الدلالية» يمكن أن تساعد 
الحاسب في فهم معنى مصادر العنكبوتية» التي يتم تجهيزها في الطبقتين السابقتين» 
عندما يستخدم ذلك التصنيف على نطاق عام. 

وتتضح نقطتان من هذا الوصف للطبقات الثانية والثالثة والرابعة للهندسة 
المعمارية للعنكبوتية الدلالية؛ أولاهما أن ما يمكن للعنكبوتية الدلالية القيام به» من 
حيث استنباط دلالات المعلومات» يمكن أن يبدو مثيرا وطموحا في الوقت نفسه. 
وثانيتهما أن كل ما يمكن أن تنهض به الطبقات الثلاث» ليس أكثر من تنظيم 
المعلومات على منصة العنكبوتية» ويتراوح هذا التنظيم بين التكشيف بالحقل (أي 
ترميز لغة الترميز القابلة للامتداد) والضبط الشامل للغة بالنسبة للعملية (كلغة 
التصنيف التخصصي على سبيل المثال). 
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العنكبوتية الدلالية وتنظيم المعلومات واسترجاعها: 

وفقا للهندسة المعارية للعنكبوتية الدلالية» التي عرضنا A AAY GU‏ فإن 
للعنكبوتية الدلالية آثارها واسعة المدىء» بالنسبة لتنظيم المعلومات واسترجاعها. 
والتنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية» والوكلاء الأذكياء» مثالان 
jal‏ هذه الآثار. 


التنظيم والاسترجاع الدلالي للمعلومات على العنكبوتية: 

يتسم استرجاع معلومات العنكبوتية بالسمعة السيئة؛ نظرا لتدني مستوى الدقة 
أو التحقيق وارتفاع التشويش. وبين) نجد هناك كثيرا من العوامل (كغياب الضبط أو 
التتحكم في المدخلات على سبيل المثال)» التي تسفر عن هذه المشكلةء يظل تكشيف 
الكلمات المفتاحية لمعلومات العنكبوتية» السبب الرئيس. وقد بذلت جهود مختلفة 
(كاستعمال رؤوس الموضوعات للتكشيف على سبيل المشال) لتوفير الكلمات غير 
المفتاحية» أو بمزيد من الدقة» التنظيم المفاهيمي لمعلومات العنكبوتية. إلا أن هذه 
الجهود قد بذلت على نطاق محدود فقطء ولم يكن لما تأثير يذكر» على الارتفاع بمستوى 
أداء تنظيم المعلومات واسترجاعها في العنكبوتية» في ظل وجود الكميات ال هائلة من 
المعلومات في هذه البيئة» بالإضافة إلى الخصائص الأخرى لمعلومات العنكبوتية. 

وتتعلق قضية التحقيق المنخفض والتشويش المرتفع» في استرجاع معلومات 
العنكبوتية» في الأساسء بالدلالات أو ”المعاني المقصودة المستعملة في التواصل 
البشري ٠‏ كا عبر عن ذلك بيرنرز-لي» وهولء وهندلر & Berners-Lee, Hall‏ 
Hendler (2006, P. 770)‏ فإذا كان بإمكان العنكبوتية الدلالية استنباط الدلالات 
من معلومات العنكبوتية» ىا كان من المنتظرء لأمكن لمشكلة التحقيق المنخفض التي 
يعاني منها استرجاع المعلومات في العنكبوتية» أن تحل» أو يتم التخفيف من حدتها على 
الأقل؛ فاستعمال لغة الترميز القابلة للامتداد XML‏ على سبيل المثالء في ترميز 
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معلومات العنكبوتية» يمكن أن يكفل للمستفيد أن يقول وداعا لاسترجاع معلومات 
العنكبوتية غير محددة الحقول» ويرحب Stok‏ البحث بالحقل. وفضلا عن ذلك 
فإن التحكم في اللغة» في تنظيم المعلومات واسترجاعها في العنكبوتية» يمكن أن يكفل 
للمستفيد القدرة على التحقق» على سبيل Le SLM‏ إذا كانت الكلمة bank‏ تعني 
مؤسسة فالية» أم الأرض المرتفعة على ضفتي النهر. ويمكن من ناحية أخرى, لتنظيم 
المعلومات الدلالية واسترجاعهاء أن يكون بإيجاز» حقيقة واقعة بمجرد أن تتطور 
الكو ةلدلا 
الوكلاء الأذكياء: 

بإمكان الوكلاء الأذكياء» باستخدام أساليب ذكاء اصطناعي متنوعة» وفي 
شكل برمجيات الحاسبات» إنجاز مهام معينة دون تدخل بشري. ومن ناحية أخرى 
فإن النظم الخبيرة تعرف lel‏ برمجيات حاسبية تدلي با معلومات» أو تصدر التوصيات» 
أو تحل المشكلات» بطريقة وعلى مستوى أداء» يضاهي ذلك الذي يبديه الخبير البشري 
في المجال. والنظم الخبيرة في جوهرها وكلاء أذكياء على نطاق واسع» أو سلاف 
الوكلاء الأذكياء. ويتزايد استعمال كلمة بوت bots‏ (الشكل المختصر لكلمة 
45 بوصفها مرادفة للوكلاء الأذكياء. 

وقد انتشر مفهوم الوكلاء الأذكياء» إلى حد ماء بفضل بيرنرز-لي» وهندلرء 
ولاسيلا )2001( Berners-Lee, Hendler & Lassila‏ عندما قدموا رسمياء 
العنكبوتية الدلالية للجمهور العام؛ ففي تلك المقالة/» وصف المؤلفون الثلاثة 
بوضوح» وكيلا قادرا على جدولة المواعيد الطبية. وقد استعرض دنت )2007( Dent‏ 


(*) تقصد المقالة التي تناول فيها المؤلفون الثلاثة فكرة العنكبوتية الدلالية. وقد وردت بيانات تلك 
المقالة كاملة في قائمة مراجع هذا الفصل. (المترجم) 
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كثيرا من الجوانب الخاصة بالوكلاء الأذكياء» كخصائصهم ووظائفهم على سبيل 
المثال» من منظور المكتبات الحديثة. وكا ذهب هندلر )1999( Hendler‏ فإن الوكيل 
الذكي المثالي» ينبغي أن يتمتع بأربع خصائص: 
.١‏ تواصليا: القدرة على فهم أهداف المستفيد وأفضلياته وحدوده. 
؟. قادرًا: أي القدرة على حسم الخيارات» لا مجرد تقديم النصح ببساطة. 
“. مسيّرا ذاتيا: القدرة على التصرف دون أن يكون تحت سيطرة المستفيد 
طوال الوقت. 


í‏ تكيفيا: القدرة على التعلم من الخبرة المكتسبة» حول مهامه وأفضليات 
المستفيد منه. 


وتطبيقات الوكلاء الأذكياء كثيرة ومتنوعة» في نطاق مجال تنظيم المعلومات 
الس وخارج هذا المجال على السواء. وأيا كان SIAL‏ الذي من أجله يتم 
تصميم الوكيل الذکي» فإنه ينبغي أن تتوافر الخصائص الأربع التي حددها هندلر. 
ويمكن الإفادة من الوكلاء الأذكياء في كثير من المواقف المختلفة» التي تتراوح بين 
أمور حياتنا اليومية» ومشروعات البحوث والتطوير المعقدة. ومن الممكن العثور على 
عدد كبير من الوكلاء الأذكياءء وخصوصا على الصعيد العام» في موقع بوتسبوت 
-Botspot (www.botspot.com)‏ 
ويستهدف الوكلاء الأذكياء؛ بالنسبة لتنظيم المعلومات واسترجاعهاء فروعا 
محددة بعينها في المجال؛ فمهام تنظيم المعلومات واسترجاعهاء المعروفة على أحسن 
جه» بشكل عام» يمكن التحقق منها dol po‏ ولهها حدود واضحة المعالم» يمكن 
للوكلاء الأذكياء النهوض ما الآن. والبث الانتقائى للمعلومات (SD1)‏ أحد أمثلة 
هذه المهام» إذ يمكن للوكلاء الأذكياء مراقبة نظام واحد لاسترجاع المعلومات أو 
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أكثر» وإخطار المستفيد عندما ترد إلى النظام معلومات جديدة في موضوع معين. 
والتقسيم الفئوي للتتائج المسترجعة» المألوف في نظم استرجاع الإنترنت» نظرا 
لضخامة كم خرجات هذه النظم» مثال آخر في هذا الصدد. وأشهر أمثلة الوكلاء 
الأذكياء في تنظيم المعلومات واسترجاعهاء برامج تجميع البيانات لنظم استرجاع 
معلومات الإنترنت» وتسمى أحيانا بالزواحف cerawlers‏ أو الشواخص الآلية 
ئه أو العناكب. ويزور هؤلاء الوكلاء المواقع المستهدفة بانتظام» ويستنسخون 
معلومات معينة» ويزسلوها إلى قاعدة بيانات النظام. 

ا SG shasta‏ 
يكون مهمة عصية بالنسبة للوكلاء الأذكياء. ويشكل الوكلاء الأذكياء بالنسبة لمهام 
تنظيم المعلومات واسترجاعهاء التي تفرض تحديات أكثرء كصياغة الاستفسارات» 
وتمثيل المعلومات أو التعبير عنهاء موضوعات للبحث في الوقت الراهن. فقد قصد 
على سبيل المثال» بأساليب الرد على الاستفسارات» التي تطبق في بعض نظم استرجاع 
المعلومات» التعرف عن طريق توجيه الأسئلة» على ما يريده المستفيد فعلاء عندما 
يكون بصدد إعداد طلب للمعلومات. ومحاولات تطوير وكلاء أذكياء بإمكانهم 
تجميع الملخصات والمستخلصات الآليةء تجري OW‏ أيضا على قدم وساق» وخصوصا 
بالنسبة للمعلومات الإخبارية» ومعلومات إدارة الأعمال (راجع (T/۲‏ 
ويتوقف نجاح هذه الجهود في النهاية» على البحث في الذكاء الاصطناعي. 


ومن الممكن النظر إلى إضفاء الطابع الشخصي على عمليات البحث» بوجه 
sele‏ بوصفه | م”دادا للوكلاء الأذكياء» حيث يكون نظام استرجاع المعلومات مصما| 
على نحو يتيح إمكانية تجميع سات المستفيد cuser profile‏ وتاريخ عملية البحث» 
وغيرها من المعلومات المتصلة بذلك المستفيد» معا لتشكيل تقنية أشبه بالوكيل. 
ويمكن تنشيط هذه التقنية في عملية الاسترجاع, لمساعدة نظام استرجاع المعلومات في 
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التعرف على ما يريده المستفيد فعلا في الموقف الراهن. فالمستفيد على سبيل SLE‏ قد 
يُدخل كلمة Java‏ كاستفسار في صندوق البحث» وحينئذ تقوم تقنية البحث ذي 
الطابع الشخصي فورّاء بإجراء سلسلة من المهام (كمراجعة سات المستفيد وتاريخ 
عملية الببحث» على سبيل المثال) للكشف عا قصد بمعنى Java‏ في هذه الحالة. وإذا 
كانت هناك للمستفيد خلفية في البريجة» فإنه من المرجح أن تكون Java‏ لغة AS pl)‏ 
يود المستفيد العثور عليها. وإذا كانت سات المستفيد لا تشتمل على معلومات حول 
البرمجة» إلا أنه يتضح من تاريخ عملية البحث الخاصة به» أن مواقع وكالات السفر 
قد تمت زيارتها مؤخراء فإن Java‏ يمكن أن تدل هنا على جزيزة جافا Java‏ في 
إندونيسيا. كذلك يمكن التحقق ما إذا كانت Java‏ نوعا من البن أم لها معانٍ أخرى» 
Ue‏ النحو نفسه» في نظام لاسترجاع المعلومات يدعم البحث الشخصي. وتخرج قضية 
الخصوصية المتصلة بالبحث الشخصي عن نطاق اهتمام هذا الكتاب. 


التحديات التى تواجهها العنكبوتية الدلالية كأحد تطبيقات الذكاء 
الاصطناعي: ١‏ 

على الرغم من التقدم الملحوظ في تطور العنكبوتية الدلالية» يتساءل كثير من 
الباحثين (من أمثال 2004 (Legg, 2007; O'Hara, 2004; Spärck Jones,‏ حول 
جدوى هذا التطبيق الخاص بالذكاء الاصطناعي. والعنكبوتية الدلالية» لم يقصد بها أن 
يتم إنشاؤها وصيانتها عن طريق البشر» كما كان يحدث في تنظيم المعلومات 
واسترجاعها بالأساليب التقليدية» وإنم| يمكن استخدام تقنيات الذكاء الاصطناعي 
بكثافة» في تطوير العنكبوتية الدلالية» وما يتبع ذلك من عمليات» على النحو الذي 
يمكن أن يثير أسئلة أكثر نما يمكن للباحثين في المجال الإجابة عليه. أما فكرة الدلالة 
التي تمثل أساس هذا التطبيق» فتضغط من ناحية أخرى على زناد المزيد من التساؤلات؛ 
نظرا OY‏ كيفية إنجاز البحث المفاهيمي concept searching‏ في بيئة آلية» كانت منذ 
زمن بعيد» مشكلة جوهرية تحظى بالدرس من جانب كثيرين في المجال. 
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وهناك في المقام dle gi pV‏ من التحديات التي تواجه رؤية العنكبوتية 
الدلالية؛ يتعلق أوهما ببذه العنكبوتية بوصفها أحد تطبيقات الذكاء الاصطناعي» 
ويتصل الآخر بقدرتها المنتظرة على نقل الدلالات بالوسائل الآلية. ونتناول النوع 
الأول من التحديات في »٤ [1١‏ عندما نلقي نظرة فاحصة على العلاقة بين الذكاء 
الاصطناعي وتنظيم المعلومات واسترجاعها. أما الضرب الآخر من التحديات 

fy Ses gill Yl‏ بال gars‏ جا توس ركيم مامات 
العنكبوتية بلغة الترميز القابلة للامتداد XML‏ ثم التعبير عنها بالرسوم البيانية 
بأشكال إطار وصف المصادر PRDF‏ ثانياء من الذي يمكن أن يتحمل مسئولية تطوير 
وصيانة خطط ad‏ الترميز القابلة للامتداد cxmlschemas‏ وخطط إطار وصف 
المصادر erdfrehemas‏ وخطط التصنيف التخصصية ontologies‏ اللازمة لضان 
استعمال الدلالات المشتركة» الناشئة عن الهندسة المعمارية للعنكبوتية الدلالية» 
والتشغيل التبادلي هذه الدلالات؟ WE‏ هل يمكن وضع تصنيف holy‏ يمكن أن 
يطبق في جميع المجالات واللغات والثقافات الموجودة على هذا الكوكب؟ ويتم طرح 
هذه التساؤلات الثلاثة في الأساس» من جانب الباحثين من خارج تجمع العنكبوتية 
العالمية W3C‏ (من أمثال Legg, 2007; O'Hara, 2004; Spärck Jones,‏ 
2004(. إلا أن بيرنرز-لي ورفاقه أنفسهم Berners-Lee, Hall & Hendler, J)‏ 
2006( يطرحون تساؤلات أخرى. ومن بين التساؤلات التي تطرحها هذه المجموعة» 
على سبيل المثال» كيف يمكن جعل كل المعلومات التي تتم معالجتها للعنكبوتية 
الدلالية» قابلة للتداول قي المجال العام» نظرا OY‏ التعامل المجاني J>lopen access‏ 
الشروط الأساس التي ينبغي للعنكبوتية الدلالية الوفاء بها. 
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وقد أثار شادبولت» وهولء وبيرنرز-لي Shadbolt, Hall and Berners-‏ 
Lee (2006)‏ المزيد من التساؤلات المتعلقة بالعنكبوتية الدلالية بوجه cele‏ عندما 
عاودوا النظر في هذه الرؤية؛ كيف على سبيل المشال» يمكننا استجواب الأعداد 
الضخمة من مستودعات المعلومات اللامركزية» متفاوتة الأحجام» على نحو فعال؟ 
كيف ننسق» ونضع خرائط الربط بين خطط التصنيف؟ كيف نبني متصفحا 
للعنكبوتية الدلالية» لتصور الرسوم البيانية لإطار وصف المصادر. المترابطة الضخمة» 
والملاحة فيها بشكل فعال؟ كيف نبني الثقة والمصداقية في المحتوى؟ . ` 

ووجهات النظر في العنكبوتية الدلالية في تغير مستمر» نتيجة للبحوث الجارية» 
والتطورات التقنية؛ فالتصنيف» على سبيل المثال» كان ينظر إليه بوصفه كيانا واحدا 
يمكن أن يشمل معارف العالم بأسره» في الهندسة المعمارية للعنكبوتية الدلالية» الواردة 
في الشكل رقم .١ /١7‏ كا تبين ed‏ بعد» أن وضع خطط التصنيف التي تركز على 
قطاعات صغيرة» أو على OVE‏ واضحة المعالم والحدود؛ ليس بالأمر غير الواقعي 
فحسب» وإنما لا يمكن تطبيقه أيضاء على النحو الذي كان يتم به إنشاء القواعد 
المعرفية للنظم الذكية في الأيام الخوالي. ومن الصعب عادة التنبؤ بالمستقبل. ويصدق 
الأمر نفسه» وعلى نحو أكثر تأكيداء فيا يتعلق بمستقبل العنكبوتية الدلالية. 


الذكاء اللاصطناعي وتنظيم المعلومات واسترجاعها: 

إلى أي مدى يمكن للذكاء الاصطناعي المضي قدما في تنظيم المعلومات 
واسترجاعها؟ ولا نجد إجابة لهذا التساؤل حتى الآن؛ نظرا لأنه في المقام الأولء يبدو 
بناء وبرمجة تقنية يمكن أن تحاكي بنجاح الأنشطة الذكية للبشر» ليس بالمهمة البسيطة. 
ويفكن WL‏ أن يكون أصعب حبة جوز يمكن كسرهاء في بوث النذكاء 
الاصطناعي )1999 .(Perscovitz,‏ 
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ومن ثم فإن دور الذكاء الاصطناعي في تنظيم المعلومات واسترجاعها اليوم 
محدود. ولا ينبغي المبالغة في هذا الدورء لسببين؛ أولما أن المهام المعقدة التي ينطوي 
عليها تنظيم المعلومات واسترجاعهاء تعتمد على رصيد معرفي واسع المدى» |S‏ تعتمد 
على استخدام هذا الرصيد على نحو مرن ويناء. وثانيها أن كثيرا من عمليات تنظيم 
المعلومات واسترجاعهاء لا تتم إلا على نحو سطحي ضحل» حتى وإن كان ذلك يتم 
بواسطة البشر )1991 .(Sparck Jones,‏ وقد علق سوانسون )1988( Swanson‏ 
ذات مرة قائلا ”على الرغم من أن هدف كثير من البحوث المتقدمة في استرجاع 
المعلومات» هو جعل الحاسبات كيانات أشبه بالبشرء فإن احتمال أن يكون الناس أشبه 
بالبشر لا ينبغي التغاضي “as‏ 

ولا ينبغي فعلا التغاضي عن دور البشر في تطوير تطبيقات الذكاء الاصطناعي؛ 
لأغراض تنظيم المعلومات واسترجاعها. فالحاسب لا يتمتع بحدة الذهن» أو العمق» 
أو الاتساع» أو الثراء الذي يتسم به الذكاء البشري؛ نظرا لأن الحاسب لا يزال أبسط 
مليون مرة من العقل البشري )2000 (Hefner,‏ إلا أنه بإمكان الذكاء الاصطناعي» 
في وضعه الراهنء أن يقدم إسهاماء في المواقف التي يمكن أن تكون فيها القاعدة 
المعرفية أو الاستدلال» محدودين في جوهرهماء أو يكون بإمكان المستفيد تعويض 
مظاهر القصور. ويمكن أيضا تطبيق الذكاء الاصطناعي في الظروف التي 
تستخدم فيها خوارزميات هذا الذكاء إلى جانب الأساليب الأخرى (Sparck‏ 
.Jones, 1991)‏ 

والتطبيقات الخاصة بتنظيم المعلومات واسترجاعهاء المعتمدة على الذكاء 
الاصطناعي» وحده أو بالإضافة إلى الأساليب الأخرى في نموء إلا أن كل أمثال هذه 
التطبيقات تقريباء إما أن تكون ما تزال في مختبرات البحث» أو تكون قد اكتسبت فعلا 
الطابع التجاري» وتتاح مقابل رسوم. ومن ناحية أخرى» تم إدخال مختلف pole‏ 
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الذكاء الاصطناعي في كثير من التطبيقات الخاصة بتنظيم المعلومات واسترجاعها. 
وقد تناول ولكس )2005( Wilks‏ بالتفصيل» بعض تجارب تطبيقات الذكاء 
الاصطناعي في JE‏ تنظيم المعلومات واسترجاعهاء وذلك في سياق إلقاء نظرة 
فاحصة على العلاقة بين الذكاء الاصطناعي واسترجاع المعلومات. ففي أي اتجاه إذن 
يسير Sle‏ تنظيم المعلومات واسترجاعهاء ونحن على مشارف العصر الرقمي؟ 
ويوحي البحث والتطوير في الذكاء الاصطناعي ببعض الاحتالات على الأقل. 
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ثبت ا مصطلحات 


(A) 
Aboutness المحتوى / المو ضوع‎ 
Abstracts المستخلصات‎ 
Access points نقاط الوصول‎ 
Ad hoc searching 
5 جه‎ ll / البحث المخصص‎ 
Adjacency searching 3 الخاد‎ enj 
پا سسا ور‎ 2 

الخوارزميات (نسبة إلى ا لخوارزمى» عام 

Algorithms : 
الرياضيات)‎ 
Analog التناظر ي‎ 
Anglo - American Cataloging Rules (AACR) -أمريكية‎ | NY ee قو اعد الفهر‎ 
Anomalies state of knowledge (ASK) i pall الحالة المعر فية غير‎ 
Artificial intelligence (AI) الذكاء الاصطناعي‎ 
Assignment indexing التكشيف بالتعيين / ال‎ 
Associative thinking ابطى / التد اعى‎ | Saji 
Audio information المعلومات الصوتية / السمعية‎ 
Automated indexing التكشف بمساعدة الآللات‎ 
Automatic translation الترجمة الآلية‎ 
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(B) 


Backlinks ` الروابط الراجعة‎ 
Batch mode التعامل على دفعات‎ 
Bayesian inference الاستدلال الافتر اضى‎ 
Bibliographic coupling l aae 
Bibliometrics القياسات الوراقية‎ 
Blogging التدوين‎ 
Book reviews مراجعات الكتب‎ 
l Boolean searching PA tol 
Buzzwords الكلات / العبارات الطنانة‎ 
(C) 


البحث بمراعاة H‏ الا iti i‏ 
بحث بمراعاة الحرف الأول Case - sensitive searching‏ 


مراعاة الحرف الأول من الكلمة Case sensitivity‏ 
التصفح العارض Casual Browsing‏ 
oe‏ / التقسيم الفئوي Categorization‏ 
اديت اللصلسل Chain indexing‏ 
الاستشهاد المرجعي Citation‏ 
التجمع العنقود Clustering‏ 
المصاحبة الوراقية Co-citation‏ 
المعرفة Cognition‏ 
لغة الأوامر Command language‏ 
التواصل/ الاتصال Communication‏ 
الأسطوانات المكتنزة Compact Disk-Read Only Memory‏ 
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Compatibility 
Concept analysis 
Concept coordination 
Concept searching 
Concordance 
Conflation 
Consistency 
Controlled language 
—Controlled vocabulary 
Coordinate indexing 
Cost-benefit 
Cost-effectiveness 
Cranfield Tests 
Crawlers 

Critical abstract 


Current Awareness 


Database 

Data mining 

Derivative indexing 
Descriptors 

Digital 

Digital Object Identifiers (DOT) 


(D) 
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التوافق / التناغم 

تحليل المفاهيم / ole pó all‏ 
ربط المفاهيم / الموضوعات 
البحث بالمفاهيم 

كشاف النصوص 

الخلط 

الاطراد 


اللغة المقيدة / المقننة 


التكشيف الترابطى 
عائد التكلفة 
فاعلية التكلفة 
تجارب كرانفيلد 
الزواحف 
المستخلص النقدي 
الإطاحة الجارية 


قاعدة البيانات/ مرصد البيانات 
التنقيب عن المعلومات 
التكشيف الاشتقاقي 

الواصفات 

ارقي 

محددات هوية الكيانات الرقمية 


Digital Versatile Disk (DVD) 
Directed Browsing 


Dublen Core 


(E) 


Effectiveness 
Enumeration 
Enumerati ve 

Exact matching 
Expert Systems 
Exploratory browsing 


Extensible Markup Language (XML) 


(F) 
Fallout 


False coordination 
Federal searching 


Feedback 
Field 


Field search 


File 
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الأسطوانة الرقمية متعددة الأغراض 
التصفح الموجه 
بؤرةدبلن 


الفاعلية 


الحصري 

المضاهاة التامة 
النظم الخبيرة 
التصفح الاستكشافي 


لغة الترميز القابلة للتوسع 


التسرب 

الربط المزيف 

البحث في مراصد بيانات متعددة/ البحث 
الموحد 

التلقيم المرتد 

الحقل 

البحث بالحقل 

املف 


File Transfer Protocol 
Folksonomy 
Function Words 


Fuzzy searching 


Gateway 
Graphical 


Go List 


Hits 
Homepage 
Hyperlinks 


Hyperstructure 
Hypertext Markup Language 


(HTML) 
Identification code 
Identifier 

Index terms 
Indexing 
Infrastructure 


Intelligent Agents 


(G) 


(H) 


(I) 
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بروتوكول نقل الملفات 

bell cde cll‏ علد 
الكلمات الوظيفية / النحوية 
البحث المشوش 


البوابة 


قائمة الاعتبار 


الصفحة الرئيس 
الروابط الفائقة 
zai‏ لتنظيم الفائق 


لغة ترميز النصوص الفائقة 


ترميز التحقق 

معرّف / محدد ال هوية 
المصطلحات الكشفية 
التكشيف 

البنية الأساس 


الوكلاء الأذكياء 


Internet Retrieval Systems 
Interoperability 

Inverse Document Frequency (IDF) 
Inverted File 

Indicative abstract 
Inductive learning 
Inference 

Inference engine 
Inference networks 

Infix 

Information access 
Informatics 

Information representation 
Information retrieval 
Information searching 
Information seeking 
Information storage 
Information technology 


Informetrics 


(J) 


Juxtaposition Searching 
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نظم استرجاع الإنترنت 

التوافقية / القابلية للتشغيل التبادل 
التردد العكسي StU‏ 

الملف المقلوب / المصنف 
المستخلص الكشفي 

التعلم الاستقرائي 

الاستدلال 

حرك الاستد لال 

شبكات الاستدلال 

الحشو (في الصرف) 

الوصول إلى المعلومات 

تقنيات المعلومات 

JEE‏ / تنظيم المعلومات 

استرجاع المعلومات 

البحث عن المعلومات 

التهاس المعلومات / البحثعن المعلومات 
اختزان المعلومات 

تقنيات المعلومات 

قياسات المعلومات 


البحث بالتجاور ' 


(K) 
Keywords : 
Keyword in Context Index (KWIC) 


Keyword indexing 


Keyword search 


Knowledge base 


(L) 


Literary warrant 
Locator 


Loud breath 

(M) 
Machine indexing 
Machine Readable Cataloging 


Magnetic Resonance Imaging (MRI) 


Menu 


Metadata 


Metaretrieval systems 
Metasearch engines 


Middle truncation 


Morpheme 
Morphology 


Multimedia 
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الكلات المفتاحية 

كشاف الكلمات المفتاحية في السياق 
التكشيف بالكليات المفتاحية 
البحث بالكلمات المفتاحية 


القاعدة المعرفية / الأساس المعرفي 


المسوغ الأدبي / مسوغ الإنتاج الفكري 


sae‏ المكان 


التنفس الجهري 


التكشيف بالآلات 

الفهرسة المقروءة آليا (مارك) ° MAR‏ 
التصوير بالرنين المغناطيسي 
قائمة الخيارات 

ما وراء البيانات 

ما وراء نظم الاسترجاع 

ما وراء حر كات البحث 

بتر الحشو / بتر وسط الكلمة 
المورفيم (أصغر وحدة صرفية) 
الصرف 

الوسائط المتعددة 


(N) 


Navigation الج‎ 
Negative searching البحث السلبي‎ 
NEsted Phrase Indexing system نظام تكشيف العبارات المسورة‎ 
(NEPHIS (نفيز‎ 
Neural Networks الشبكات العصبية‎ 
„Newswires الشبكات الإخبارية‎ 
Node النقطة الارتكازية‎ 
Noise Factor معامل (التشويش/ الصخب)‎ 
Notched Cards البطاقات المثلومة‎ 
(O) 
Objectivity الموضوعية‎ 
Ofness الوصف‎ 
Online Hubli Access Catalog الفهرس المتاح على الخط المباشر‎ 
(OAPC (أوباك‎ 
Online systems نظم الخط المباشر‎ 
Ontology التصنيف التتخصصي‎ 
Open access التعامل المجاني‎ 
Operator المعامل‎ 
Optical Character Recognitio PE E : 
(OCR) gmtion ضوثيا‎ 3 > VI التعرف على‎ 
Organic User Interface (DUD zeilen 
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(P) 


Partial matching 
Parsing 

Passage retrieval 
Pattern recognition 
Peer-to-peer (P2P) searching 
Phrase searching 
Pooling 

Portable 

Portal 

Positional matching 
Post-coordination 
Precision 


Pre-coordination 


PRE served Context Index System 
(PRECIS (بريسيز‎ , 


Proximity searching 
Pull-down menu 


(Q) 


Quasi-Concept Searching 


Quasi Fields 
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المضاهاة 4552-1 
التحليل / الإعراب 
استرجاع الفقرات 
التعرف على big‏ 
بحث الانداد 
البحث بالعبارات 
التجميع البؤري 
متعدد ا منخصات 
المرفاً 

المضاهاة الموضعية 
الربط اللاحق 


التحقي 


= 


الربط المسبق 
نظام تكشيف السياق المصون 


البحث بالتقارب 


قائمة الخيارات المنسدلة 


البحث شبه المفاهيمي / شبه الموضوعي 


أشباه الحقول 


Query by example 

Query by Image Content (QBIC) 
Query Contraction 

Query expansion 

Query formulation 

Query modification 

Query parsing 

“Question answering 


(R) 


Radio Frequency Identification 
(RFID) 


Range matching 


Ranking 
Really Simple Syndication (RSS) 


Recall 
Record 


Reference interview 


Relative recall 
Relevance 
Resource Description Framework 


(RDF) 


Reviews 
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JUL الاستفسار‎ 

الاستفسار بمحتوى الصورة 
تقليص الاستفسار 

توسعة الاستفسار 

صياغة الاستفسار 

تعديل الاستفسار 

تحليل الاستفسار 

الرد على الاستفسارات 


التحقق بالتردد اللاسلكي 


المضاهاة بالمدى 

الترتيب الطبقي 

الإخطار البسيط فعلا 
الاستدعاء 

التسجيلة 

المقابلة المرجعية 

الاستدعاء النسبي 

الصلاحية / الاتصال بالموضوع 


إطار وض المصادر 


المراجعات العلمية 


Rich Site Summary (RSS) 


Right truncation 
Robots 


‘Routing 


(S) 


Search engine 
Search mechanism 


Search / Retrieve Web (SRW) 


Search strategy 


Selective Dissemination of 
Information (SDI) 


Semantic image 
Semantic networks 
Semantic Web 
Sequential file 
Showcases 

Site 

Speech recognition 
Social Tagging 
Spiders 

Spoken documents 


Stemming 
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ملخص الموقع الثري 
بتر عجز الكلمة 
الشخوص الآلية 


التوجيه / تحديد المسار 


محرك البحث 
البحث والاسترجاع في العنكبوتية 
Leal ful‏ التق 


البث الانتقائي للمعلومات 


الصورة الدلالية 
الشبكات الدلالية 
العنكبوتية الدلالية 
الملف التسلسلي 
نوافذ العرض 
الوقع 

التعرف على الحديث 
التمييز الاجتماعي 
العناكب 

الوثائق الناطقة 

رد الكلمة إلى الجذع 


Stop list 

String indexing 
Stripping 
Summarization 
Surrogates 
Symbolic reasoning 
Syntax 

Synapses 


Synthesis 


Tag Cloud 
Tagging 

Tags 

Taxonomy 
Techniques 
Term Frequency 
Terminals 


Term Masking 


Term Weighting 


(T) 
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قائمة الاستبعاد 
التكشيف التسلسلي 
تجريد الكلمة 
التلخيص 

pla 

المنطق الرمزي 
النظم/ النحو 

نقاط الترابط العصبية 


التركيب 


المنافذ 
إخفاء Las‏ المصطلحات 
وزن المصطلحات 


Threshold 


Topic Sentences 


Truncation 


(U) 
Unified Resource Identifier (URD 
Unified Resource Locator (URL) 


Uniterm 
Usability 


User - friendliness 
User - Friendly 


User profile 
User warrant 
Utility 
(V) 
Vector Space Model 


Vocalization 


Vortals 
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الحد الأدنى / العتبة 
الجمل الموضوعية 


pal 


المحدد الموحد لموية المصدر 


المحدد الموحد لمكان المصدر 


المصطلح الأحادي 


سهولة التعامل / التعاطف مع المستفيد 
سهولة التعامل / متعاطف مع المستفيد 
سهات المستفيد 
مسوغ المستفيد 


الجدوى 


التلفظ / النطق 
المرافوع الرأسية / المتخصصة 


(W) 


Web 2.0 

Webmaster 

Webpage 

Weighte searching 

Wide Area Information Servers 
(WAIS) 


Wildcard 


World Wide Web (WWW) 
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الجيل الثاني للعنكبوتية 
مسئول العنكبوتية 
البحث بالوزن 


Gall العلومات واسعة‎ Jus 


التبديل 


العنكبوتية العالمية 


المؤلفة في سطور: 
هتنج تشو Heting Chu‏ 

ولدت في الصينء عام .1۹١۷‏ وحصلت على ليسانس في علم المكتبات» فى 
جامعة بكين» الصين» وعلى ماجستير المكتبات والمعلومات» فى جامعة ماجل» كنداء 
وعلى دكتوراه دراسات المعلومات» فى جامعة دركزل» الولايات المتحدة الأمريكية. 
وقد عملت أستاذا مساعداء لمدة عام واحد» فى جامعة سانت جونز» الولايات المتحدة 
الع عبتت VANE pate ds‏ انان ages‏ كاذ تدع اياك 
والمعلومات» فى جامعة لونج أيلاند» الولايات المتحدة الأمريكية. ومع تقدمها في 
مسارها العلمي» تغير توجهها الموضوعي من علم المكتبات بوجه ep le‏ إلى استرجاع 
المعلومات على وجه الخصوص. وقد ألفت خمسة كتب بالصينية» حول استرجاع 
المعلومات» وما يتصل به من موضوعات» (S‏ أسهمت منذ عام ۱۹۹۷ بسبعة كتب 
بين التأليف والتحرير. وتشمل اهتتاماتها البحثية والتدريسية استخدام تقنيات 
المعلومات في المكتبات» ومناهج البحث» والاتصال العلمى. وها أكثر من أربعين 
مقالة في موضوعات المكتبات الرقمية» والكتب والدوريات الإلكترونية» ومحركات 
البحث في العنكبوتية العالمية» وتطبيقات الجيل الثاني للعنكبوتية. وها Laid‏ نشاطها 
العلمي والمهني واسع المدى» على المستويات المحلية والوطنية والدولية. 
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المترجم فى سطور: 


أستاذ علم المعلومات المتفرغ فى كلية الآداب - جامعة القاهرة. ولد فى عزبة 
قاسم» مركز بسيون» محافظة الغربية» في NAET Y/N‏ وقد تخرج في الوثائق 
E‏ اقرف قل الأدات ت rp eae‏ قت 
وحصل على الماجستيرٍ في التوثيق العلمى» فى الكلية نفسها عام 1۹۷١‏ وحصل على 
الدكتوراه ف علم المعلومات» فى جامعة لندن عام 191/8. وقد تدرج في وظائف 
التدريس بكلية الآداب - جامعةالقاهرة منذ عام NATE‏ أعير خبيرا للمكتبات» فى 
es ER NS‏ الدار الكتب الوطنية في أبو ظبي» ثم أستاذا 
لجامعة الإمام محمد بن سعود الإسلامية فى الرياض. وقد عمل خبيرا ومستشارا في 
المكتبات وتنظيم المعلومات» في عدد من المؤسسات المصرية والعربية والدولية» كا 
شارك في كثير من المؤتمرات الوطنية cdl gills‏ ورأس تحرير مجلة ”دراسات عربية في 
المكتبات وعلم المعلومات“. وله الكثير من الأعمال المنشورة» من الكتب المؤلفة» 
والكتب المترجمة» والبحوث والمقالات» ومراجعات الكتب. ويبدي في أعماله العلمية 
اهتهاما خاصا بأصول علم المعلومات» والاتصال العلمىء وإدارة مرافق المعلومات» 
obs,‏ المعلومات» وتقنيات المعلومات في المكتبات» والقياسات الوراقية 
والمعلوماتية بوجه عام. وقد حصل على جائزة معهد المعلومات العلمية TST‏ على 
fae‏ نشاطه العلمی» عام „Ye eY‏ 
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التصحيح اللغوى: محمد أبو العز 


الإشراف الفنى: حسن كامل 


5 
الفلاذ‎ A 


: جاسر 


P jaa 


© 


المعلومات واسترجاعهاء بجانبيه النظرى والتطبيقى. lags:‏ بنظرة 
١‏ تاريخية موجزة» تربط الماضي بالحاضر ) لاستشراف أفاق المسغبل! 
J Lx Ls‏ ل بأسلوب سلس بالغ الوضوح والإيجاز. خصائص المعلومات 
الرقمية» والأساليب والطرق والنظم والممارسات التي نشأت وتطورت 
في ظل الإنترنت. وفضلا عن اهتمامه بالجوانب التقنية» يبدي هذا 
OLS!‏ اهماما راضحا بالمسطيد من المعلومات: من سيف 
احتياجاته وأنماط وسبل تفاعله مع نظم استرجاع المعلومات بكل 


فئاتها. وبالإضافة إلى الشمول في معالجة قضايا المجال» يوثق الكتاب 
ارتباط القارئ برصيد الإنتاج الفكري الفري» من خلال منظومة 
الاستشهادات المرجعية الموزعة على الفصول الاثني عشر. وكما 
يخاطب هذا الكتاب الدارسين والممارسين والباحثين في مجال تنظيم 
EEE‏ اح ا ا 








